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从 读 博士 起 ， 我 对 编程 的 兴趣 忽然 浓厚 起 来 。 当 时 做 大 规模 并 行 
运算 ， 需 要 自己 写 很 多 程序 和 脚本 。 作 为 新 进 研究 组 的 新 人 ， 我 自觉 
负担 起 很 多 写 程 序 的 活 儿 。 写 得 多 了 ， 兴 趣 也 变 得 浓厚 。 


那个 时 候 抓 紧 一 切 机 会 学 习 编 程 。 在 我 读 博 的 研究 所 里 ， 有 一 位 
英国 教授 也 喜欢 编程 。 她 叫 爱 玛 : 希 尔 (Emma Hill) ， 教 我 们 用 编程 
语言 处 理 地 球 科 学 的 数据 。 有 一 天 ， 我 路 过 她 的 办 公 室 。 她 问 我 最 近 
的 学 习 进 度 。 


“准备 学 Perl 呢 ，” 我 回答 说 ,，“ 感 觉 Perl 在 地 理 领域 应 用 很 广 。” 


“你 为 什么 不 学 学 Python 呢 ?” 爱 玛 问 我 ,，“ 这 门 语言 发 展 很 快 。 你 
学 会 了 或 许可 以 教 教 我 。” 


我 之 前 听 过 Python 的 一 些 传闻 ， 比 如 那 句 著名 的 “人生 苦 短 ， 我 用 
Python”。 但 我 担心 Python 在 地 球 科学 研究 方面 不 如 Perl 积 累 深 厚 。 有 
了 爱 玛 的 鼓励 ， 我 下 定 决 心 去 研究 Python。Python 学 起 来 确实 很 快 。 
没 过 多 久 ， 我 就 可 以 用 Python 来 解决 我 在 科研 中 遇 到 的 大 部 分 问题 
了 。 记 忆 比 较 深 刻 的 是 ， 有 一 次 下 载 来 自 美 国 研究 所 的 一 批 气象 数 
据 。 我 用 Python 中 的 多 线程 并 发 下 载 ， 创 造 了 大 学 中 网 络 传输 的 纪 
录 。 学 习 加 实践 ， 让 我 爱 上 了 这 门 语言 。 


随后 ， 我 开始 写 一 系列 博客 ， 记 录 自 己 学 习 Python 的 过 程 。 这 一 
系列 的 文章 叫 “Python 快 速 教程 "。 我 想 在 这 些 文章 中 呈现 出 Python 简 
单 易 学 的 特点 ， 以 便 让 更 多 的 人 也 来 享受 编程 的 乐趣 。 在 写作 过 程 中 
我 意识 到 ， 要 想 讲 明白 一 门 编程 语言 ， 还 要 引入 额外 的 背景 知识 。 我 


的 编程 博客 也 从 Python 开始 ， 拓 展 到 网 络 协议 、 操 作 系统 、 算 法 、 数 
据 分 析 等 方面 。 写 的 时 间 越 长 ， 收 获 的 读者 也 越 来 越 多 。 每 当 有 人 告 
诉 我 看 着 我 的 文章 学 会 编程 时 ， 我 总 会 感到 惊喜 。 因 此 ， 我 非常 感谢 
爱 玛 给 我 推 开 的 这 扇 门 。 


完成 博士 学 业 之 后 ， 我 需要 在 科研 和 编程 之 间 选 择 。 由 于 编程 读 
给 我 的 美好 体验 ， 我 曼 不 犹 物 地 选择 了 编程 。 将 近 三 十 多 的 我 ， 和 二 
十 出 头 的 年 轻 人 一 起 做 产品 、 调 试 、debug。 我 必须 要 非常 努力 ， 才 能 
赶 上 这 群 富有 天 赋 而 精力 旺盛 的 年 轻 人 。 但 我 并 不 觉得 壮 苦 。 洗 香 是 
学 习 的 台阶 。 在 编程 中 ， 我 享受 着 脑 细 胞 的 疯狂 激活 ， 享 受 着 未 知 错 
误 的 折磨 ， 以 及 昔 昔 思索 之 后 的 容 然 开朗 。 更 棒 的 是 ， 我 的 伙伴 总 是 
以 乐观 的 态度 来 看 待 技术 ， 以 享受 的 心态 来 享受 编程 。 我 从 中 受益 展 
多 。 更 何况 ， 计 算 机 浪潮 已 经 并 将 继续 改变 世界 。 我 很 冬运 ， 能 加 入 
浪潮 中 。 


“Python 快速 教程 ”得 到 了 不 少 编辑 的 认可 。 他 们 希望 我 能 把 博客 
文章 改编 成 一 本 书 。 写 书 当然 是 莫大 的 荣 考 ， 我 很 感谢 每 一 位 编辑 的 
赏识 。 可 在 博士 学 业 的 压力 下 ， 我 能 抽出 的 时 间 实 在 有 限 。 终 于 拖 到 
博士 毕业 ， 我 才 开 始 认真 整理 之 前 的 文章 。 把 略 显 凌乱 的 博客 文章 改 
编 成 书 ， 工 作 量 比 我 想象 的 要 大 得 多 。 在 此 期 间 ， 我 也 开始 了 一 个 新 
的 项 目 ， 研 发 一 款 用 于 畜牧 的 智能 心 片 。 生 活 的 节奏 又 变 得 忙碌 ， 能 
分 给 写 书 的 时 间 大 大 减少 。 结 果 ， 从 签 合 约 到 完稿 ， 我 花 了 超过 半年 
的 时 间 。 和 幸好 编辑 安娜 对 我 的 拖延 症 格外 包容 。 


这 本 书 的 最 终 诞 生 ， 有 赖 于 许多 人 的 支持 。 感 谢 父 母 对 我 的 激励 
和 教育 ， 感 谢 妻 子 一 直 以 来 的 陪伴 。 雷 雨田 绘制 的 精美 插画 ， 让 枯燥 
的 技术 书 变 得 生动 有 趣 。 在 写作 博客 的 过 程 中 ， 许 多 读者 都 指正 过 文 
章 中 的 错误 ， 或 者 对 写作 方向 提出 建议 。 在 成 书 过 程 中 ， 王 豪 、 周 上 昕 


梓 和 黄 杜 立 对 文章 进行 审阅 校正 。 正 是 因为 他 们 的 审阅 校正 ， 我 才能 
放心 地 交 稿 。 此 外 还 有 很 多 帮助 过 我 的 人 ， 不 能 一 一 列举 ， 只 好 一 并 
表达 感激 。 


在 我 现在 的 工作 中 ，Python 依 然 占 据 着 重要 的 地 位 。 我 会 用 
Python 进行 网 站 开 友 和 大 数据 分 析 ， 还 会 用 Python 来 写 一 些 在 单片机 
上 运行 的 脚本 。 当 然 ， 我 也 离 不 开 其 他 语言 ， 比 如 处 理 数据 库 的 
SQL、 编 写 安 瞳 App 的 Java、 开 发 网 页 前 端的 JavaScript 等 。 但 Python 计 
我 爱 上 编程 。 我 也 希望 ， 这 本 书 能 让 读者 也 爱 上 Python ， 并 且 继续 像 
我 的 博客 文章 一 样 ， 能 帮助 到 那些 想 学 习 编程 的 人 。 在 此 存 一 个 美好 
心愿 。 
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第 1 章 ”用 编程 改造 世界 


1.1 从 计算 机 到 编程 
1.2 ”所 谓 的 编程 ， 是 做 什么 的 
1.3 为 什么 学 Python 
1.4 ”最 简单 的 Hello World 
附录 A Python 的 安装 与 运行 


附录 B virtualenv 


本 章 将 简要 介绍 计算 机 和 编程 的 历史 。 从 计算 机 出 现 以 来 ， 硬 件 
性 能 得 到 飞跃 式 的 发 展 。 与 此 同时 ， 编 程 语 言 也 几经 变迁 ， 产 生 了 多 
种 编程 范式 。Python 语 言 以 简洁 灵活 的 特点 ， 在 诸多 编程 语言 中 打下 
一 片 天 地 。 通 过 历史 ， 我 们 不 但 能 体验 Python 的 特色 ， 还 能 了 解 这 门 
语言 想 要 解决 的 痛 点 。 本 章 将 以 一 个 简单 的 “Hello World!” 程 序 结束 ， 
从 此 开启 Python 之 旅 。 


1.1 从 计算 机 到 编程 


人 能 运算 和 记忆 ， 但 更 了 不 起 的 是 善于 借用 工具 。 人 类 很 早 就 开 
始 利 用 方法 和 工具 ， 辅 助 计算 和 记忆 这 样 高 度 复 杂 的 认 知 活动 。 古 人 
用 给 绳子 打 结 的 方式 来 记录 圈养 的 牛 羊 ， 我 们 的 祖先 很 早 就 能 以 眼花 
缔 乱 的 速度 使 用 算盘 。 随 着 近代 工业 化 的 发 展 ， 社 会 对 计算 的 需求 越 
来 越 强烈 。 收 税 需要 计算 ， 造 机 器 需要 计算 ， 开 挖 运河 也 需要 计算 。 
新 的 计算 工具 不 断 出 现 。 利 用 对 数 原理 ， 人 们 制造 出 计算 尺 。 计 算 尺 
可 以 平行 移动 尺子 来 计算 乘除 法 。19 世 纪 的 英国 人 巴 贝 奇 设计 了 一 台 
机 器 ， 用 齿轮 的 组 合 来 进行 高 精度 的 计算 ， 隐 隐 预 示 着 机 器 计算 的 到 
来 。20 世 纪 初 有 了 机 电 式 的 计算 机 器 。 电 动 马达 驱动 变 档 齿轮 “了 咯 咬 ” 
转动 ， 直 到 得 到 计算 结果 。 


二 战 期 间 ， 战 争 刺 激 了 社会 的 计算 需求 。 武 器 设计 需要 计算 ， 比 
如 坦克 的 设计 、 洪 艇 的 外 形 、 弹 道 的 轨迹 。 社 会 的 军事 化 管理 需要 计 
算 ， 比 如 火车 调度 、 资 源 调配 、 人 口 动员 。 至 于 导弹 和 核弹 这 样 的 高 
科技 项 目 ， 更 需要 海量 的 计算 。 美 国 研制 原子 弹 的 曼哈顿 计划 ， 除 了 
使 用 IBM 的 计算 机 器 外 ， 还 雇佣 了 许多 女孩 子 进行 手工 运算 。 计 算 本 
身 甚 至 可 以 成 为 武器 。 电 影 《 模 仿 游戏 》 就 讲述 了 英国 数学 家 阿兰 :图 


灵 (Alan Mathison Turing) 破解 德国 传奇 密码 机 的 故事 。 图 灵 的 主要 
工具 ， 就 是 机 电 式 的 计算 机 器 。 值 得 一 提 的 是 ， 正 是 这 位 图 灵 ， 提 出 
了 通用 计算 机 的 理论 概念 ， 为 未 来 的 计算 机 发 展 做 好 了 理论 准备 。 现 
在 ， 计 算 机 学 科 的 最 高 奖项 就 以 图 灵 命 名 ， 以 纪念 他 的 伟大 贡献 。 德 
国 工程 师 康 拉 德 . 楚 泽 (Konrad Zuse) 发 明 的 Z3 计 算 机 能 编写 程序 。 
这 看 起 来 已 经 是 一 台 现 代 计 算 机 的 雏形 了 。 


计算 工具 的 发 展 是 渐进 的 。 不 过 历史 把 第 一 台 计 算 机 的 桂冠 颁 给 
了 战 后 宾夕法尼亚 大 学 研制 的 埃 尼 阿 克 (ENIAC, Electronic 
Numerical Integrator And Computer) 。 埃 尼 阿 克 借 鉴 了 前 任 的 经 验 ， 
远 非 横 空 出 世 的 奇迹 。 但 它 最 重要 的 意义 ， 是 向 人 们 展示 了 高 速 运算 
的 可 能 性 。 首 先 它 是 一 台 符 合 图 灵 标 准 的 通用 计算 机 ， 能 通过 编程 来 
执行 多 样 的 计算 任务 。 其 次 ， 与 机 电 式 计算 机 器 不 同 ， 埃 尼 阿 克 大 量 
使 用 真空 管 ， 从 而 能 快速 运算 。 埃 尼 阿 克 的 计算 速度 比 之 前 的 机 电 型 
机 器 提高 了 一 千 倍 ， 这 是 一 次 革命 性 的 飞跃 。 因 此 ， 即 便 计 算 辅 助 工 
具 同 样 历史 悠久 ， 但 人 们 仍 认为 埃 尼 阿 克 引 领 了 一 个 新 的 时 代 一 计算 
机 时 代 。 


从 埃 尼 阿 元 开始， 计算 机 经 历 了 迅 镍 的 发 展 。 计 算 机 所 采用 的 主 
要 元 件 ， 从 真空 管 变 成 大 规模 集成 电路 。 计 算 机 的 运算 性 能 ， 每 一 两 
年 的 时 间 就 会 翻 倍 。 但 计算 机 的 大 体 结构 ， 都 采用 了 冯 : 诺 依 曼 体 系 。 
这 一 体系 是 长 期 演化 的 结果 ， 但 冯 诺 依 曼 进 行 了 很 好 的 总 结 。 按 照 冯 : 
诺 依 曼 的 设计 ， 计 算 机 采用 二 进 制 运算 ， 包 括 控制 器 、 运 算 器 、 存 储 
器 、 输 入 设备 和 输出 设备 五 个 部 分 ， 如 图 1-1 所 示 。 五 个 部 分 相互 配 
合 ,执行 特定 的 操作 ， 即 指令 。 这 五 个 部 分 各 有 分 工 。 


输入 设备 


z 输出 设备 


图 1-1 BEREAN 


1. 控制 器 : 计算 机 的 指挥 部 ， 管 理 计算 机 其 他 部 分 的 工作 ， 决 定 执 
行 指令 的 顺序 ， 控 制 不 同 部 件 之 间 的 数据 交流 。 

运算 器 : 顾名思义 ， 这 是 计算 机 中 进行 运算 的 部 件 。 除 加 减 乘除 
之 类 的 算数 运算 外 ， 还 能 进行 与 、 或 、 非 之 类 的 逻辑 运算 。 运 算 
器 与 控制 器 一 起 构成 了 中 央 处 理 器 (CPU, Central Processing 
Unit) 。 

. 存储 器 : 存储 信息 的 部 件 。 冯 : 诺 依 曼 根据 自己 在 曼哈顿 工程 中 的 
经 验 ， 提 出 了 存储 器 不 但 要 记录 数据 ， 还 要 记录 所 要 执行 的 程 
序 。 

输入 设备 : 向 计算 机 输入 信息 的 设备 ， 如 键盘 、 鼠 标 、 摄 像 头 
等 。 

输出 设备 : 计算 机 向 外 输出 信息 的 设备 ， 如 显示 屏 、 打 印 机 、 音 
响 等 。 
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人 们 最 常 想 到 的 计算 机 是 台式 机 和 笔记 本 电脑 。 其 实 ， 计 算 机 还 
存在 于 智能 手机 、 汽 车 、 家 电 等 多 种 设备 中 。 但 无 论 外形 如 何 多 变 ， 
这 些 计 算 机 都 沿袭 了 冯 : 诡 依 曼 结 构 。 不 过 在 具体 细节 上 上， 计算机 之 间 
又 有 很 大 的 差别 。 有 的 计算 机 使 用 了 多 级 缓存 ， 有 的 计算 机 只 有 键盘 


没有 鼠标 ， 有 的 计算 机 用 磁带 存储 。 计 算 机 的 硬件 是 一 门 很 庞杂 的 学 
问 。 笠 运 的 是 ， 计 算 机 用 户 大 多 不 需要 和 硬件 直接 打交道 。 这 一 点 是 
操作 系统 (Operating System) 的 功劳 。 


操作 系统 是 运行 在 计算 机 上 的 一 套 软 件 ， 负 责 管理 计算 机 的 软 硬 
件 资源 。 有 的 时 候 我 们 请 人 修 电脑 ， 他 可 能 会 说 “电脑 需要 重 沪 一 
下 ”。 这 个 “ 重 装 ”， 就 是 重新 安装 操作 系统 的 意思 。 无 论 是 微软 的 
Windows， 还 是 苹果 的 0S， 都 属于 操作 系统 。 我 们 编程 时 ， 大 多 数 时 
候 都 是 通过 操作 系统 这 个 “中 间 商 ”来 和 硬件 打交道 的 。 操 作 系统 提供 
了 一 套 系统 调用 (System Call) ， 如 图 1-2 所 示 ， 规 定 了 操作 系统 支持 
哪些 操作 。 当 调用 某 个 系统 调用 时 ， 计 算 机 会 执行 对 应 的 操作 。 这 就 
像 是 按 下 钢琴 上 的 一 个 键 ， 钢 琴 就 会 发 出 对 应 的 音律 一 样 。 系 统 调用 
提供 的 功能 非常 基础 ， 有 时 调用 起 来 很 麻烦 。 操 作 系 统 因 此 定义 一 些 
FER (Library Routine) ， 将 系统 调用 组 合成 特定 的 功能 ， 如 同 几 个 
音律 组 成 的 和 弦 。 所 谓 的 编程 ， 就 是 用 这 些 音 律 和 和 弦 ， 来 组 成 一 首 
美妙 的 音乐 。 


图 1-2 硬件、 操作 系统 和 应 用 程序 的 天 系 


1.2 所谓 的 编程 ， 是 做 什么 的 


编程 中 总 是 在 调用 计算 机 的 基本 指令 。 如 果 完 全 用 基础 指令 来 说 
明 所 有 的 操作 ， 代 码 将 超 乎 想象 的 元 长 。IBM 前 总 裁 小 沃 森 的 自传 中 
就 提 到 ， 他 看 到 一 位 工程 师 想 要 做 乘法 运算 ， 输 入 程序 用 的 打 孔 卡 苇 
起 来 有 1.2 米 高 。 乎 好， 程序 员 渐渐 发 现 ， 许 多 特定 的 指令 组 合 会 重复 
出 现 。 如 果 能 在 程序 中 复 用 这 些 代码 ， 则 可 以 节省 很 多 工作 量 。 复 用 
代码 的 关键 是 封装 (Packaging) ， 即 把 执行 特殊 功能 的 指令 打包 成 一 
个 程序 块 ， 然 后 给 这 个 程序 块 起 个 容易 查询 的 名 字 。 如 果 需 要 重复 使 


用 这 个 程序 块 ， 则 可 以 简单 地 通过 名 字 调 用 。 就 好 像 食 客 在 点 荣 时 ， 
只 需 告诉 厨师 做 * 鱼 香 肉 丝 "， 而 不 需要 具体 说 明 要 多 少 肉 、 多 少 调 
料 、 豪 制 多 久 一 样 。 刚 才 提 到 的 操作 系统 ， 就 是 将 一 些 底 层 的 硬件 操 
作 组 合 封装 起 来 ， 供 上 层 的 应 用 程序 调用 。 当 然 ， 封 装 是 有 代价 的 ， 
它 会 消耗 计算 机 资源 。 如 果 使 用 的 是 早期 的 计算 机 的 话 ， 封 装 和 调用 
的 过 程 会 非常 耗 时 ， 最 终 得 不 偿 失 。 


封装 代码 的 方式 也 有 很 多 种 。 根 据 不 同 的 方式 ， 程 序 员 写 程序 时 
要 遵循 特定 的 编程 风格 ， 如 面向 过 程 编程 、 面 向 对 象 编 程 和 函数 式 编 
程 。 用 更 严格 的 术语 来 说 ， 每 种 编程 风格 都 是 一 种 编程 范式 
(Programming Paradigm) 。 编 程 语 言 开 始 根据 编程 范式 区 分 出 阵 
营 ， 面 向 过 程 的 C 语 言 、 面 向 对 象 的 Java 语 言 、 面 向 疯 数 的 Lisp 语 言 
等 。 任 何 一 种 编程 范式 编写 出 来 的 程序 ， 最 终 都 会 翻译 成 上 面 所 述 的 
简单 功能 组 合 。 所 以 编程 的 需求 总 是 可 以 通过 多 种 编程 范式 来 分 别 实 
现 ， 区 别 只 在 于 这 个 范式 的 方便 程度 而 已 。 由 于 不 同 的 范式 各 有 利 
弊 ， 所 以 现代 不 少 编程 语言 都 支持 多 种 编程 范式 ， 以 便 程序 员 在 使 用 
时 取舍 。Python 就 是 一 门 多 范式 语言 。 某 一 范式 的 代表 性 语言 ， 也 开 
始 在 新 版 本 中 支持 其 他 范式 。 原 本 属于 面向 对 银 沁 式 的 Java 语 言 ， 就 
在 新 版 本 中 也 开始 加 入 函数 式 编 程 的 特征 。 


编程 范式 是 学 习 编程 的 一 大 拦路 虎 。 对 于 一 个 程序 员 来 说 ， 如 果 
他 熟悉 了 某 一 种 编程 范式 ， 那 么 他 就 能 很 容易 地 上 手 同一 范式 的 其 他 
编程 语言 。 对 于 一 个 新 手 来 说 ， 一 头 扎 进 Python 这 样 的 多 范式 语言 ， 
会 发 现 同一 功能 有 不 同 的 实现 风格 ， 不 免 会 感到 困惑 。 一 些 大 学 的 计 
算 机 专业 课程 ， 选 择 了 分 别 讲授 代表 性 的 和 范式 语言 ， 比 如 C、Java、 
Lisp， 以 便 学 生 在 未 来 学 习 其 他 语言 时 有 一 个 好 的 基础 。 但 这 样 的 做 
法 ， 会 将 学 习 过 程 拉 得 很 漫长 。 在 我 看 来 ，Python 这 样 的 多 范式 语言 


提供 了 一 个 对 比 学 习 多 种 编程 范式 的 机 会 。 在 同一 语言 框架 下 ， 如 果 
程序 员 能 清晰 地 区 分 出 不 同 的 编程 范式 ， 并 了 解 各 自 的 利 蜂 ， 将 起 到 
事半功倍 的 效果 。 这 也 是 本 书 中 想 要 做 到 的 ， 从 面向 过 程 、 面 向 对 
象 、 函 数 式 三 种 主流 范式 出 发 ， 在 一 本 书 的 篇 幅 内 学 三 遍 Python。 这 
样 的 话 ， 读 者 将 不 止 是 学 会 了 一 门 Python 语言 ， 还 能 为 未 来 学 习 其 他 
语言 打 好 基础 。 


学 习 了 包括 Python 在 内 的 任何 一 门 编程 语言 后 ， 就 打开 了 计算 机 
世界 的 大 门 。 通 过 编程 ， 你 几乎 可 以 发 挥 出 计算 机 所 有 的 功能 ， 给 创 
造 力 提供 了 广阔 的 施展 空间 。 想 到 某 个 需求 ， 比 如 统计 金庸 小 说 中 的 
词 频 ， 目 己 就 能 写 程 序 解决 。 有 了 不 销 的 想法 ， 例 如 想 建立 一 个 互助 
学 习 的 网 站 ， 也 可 以 立即 打开 电脑 动手 编写 。 一 旦 学 会 了 编程 ， 你 会 
发 现 ， 软 件 主要 比拼 的 就 是 大 脑 和 时 间 ， 其 他 方面 的 成 本 都 极为 低 
廉 。 编 写 出 的 程序 还 会 有 许多 回报 。 可 以 是 经 济 性 的 回报 ， 比 如 获得 
高 工资 ， 比 如 创立 一 家 上 市 的 互联 网 企业 。 也 可 以 是 声誉 性 的 回报 ， 
比如 做 出 了 很 多 人 喜爱 的 编程 软件 ， 比 如 攻克 了 困扰 编程 社区 的 难题 
等 。 正 如 《黑客 与 画家 》 一 书 中 所 说 ， 程 序 员 是 和 男 家 一 样 的 创作 
者 。 无 穷 的 创造 机 会 ， 正 是 编程 的 一 大 魅力 所 在 。 


编程 是 人 与 机 器 互动 的 基本 方式 。 人 们 通过 编程 来 操纵 机 器 。 从 
18 世 纪 的 工业 革命 开始 ， 人 们 逐渐 摆脱 了 手工 业 的 生产 方式 ， 开 始 转 
向 机 器 生产 。 机 器 最 开始 用 于 棉纺 工业 ， 一 开始 纺 出 的 纱 线 质量 比 不 
上 手工 纺 制 的 。 但 机 器 可 以 昼夜 工作 ， 不 知 疲倦 ， 产 量 也 是 惊人 。 因 
此 ， 到 了 18 世 纪 末 ， 全 球 大 部 分 的 棉布 都 变 成 了 机 器 生产 。 如 今 ， 机 
器 在 生活 中 已 经 屡见不鲜 。 人 工 智 能 这 样 的 “ 软 性 机 器 *， 也 越 来 越 多 
地 进入 生产 和 生活 。 工 人 用 机 器 来 制造 手机 、 医 生 操 纵 机 器 来 进行 微 
创 手 术 、 交 易 员 用 机 器 进行 高 频 的 股票 交易 。 残 酷 一 点 讲 ， 对 机 器 的 


调配 和 占有 能 力 ， 将 会 取代 血统 和 教育 ， 成 为 未 来 阶级 区 分 的 衡量 标 
准 。 这 也 是 编程 教育 变 得 越 来 越 重要 的 原因 。 


机 器 世界 的 变化 ， 正 在 改变 世界 的 工作 格局 。 重 复 性 工作 消亡 ， 
程序 员 的 需求 量 却 在 不 断 加 大 。 很 多 人 都 在 自学 编程 ， 以 便 跟 上 潮 
流 。 平 好 ， 编 程 也 变 得 越 来 越 简单 。 从 汇编 语言 ， 到 C 语 言 ， 再 到 
Python 语言 ， 编 程 语言 越 来 越 亲 民 。 以 Python 为 例 ， 在 丰富 的 模块 文 
持 下 ， 一 个 功能 的 实现 只 需要 寥寥 几 个 接口 的 调用 ， 不 需要 费 太 多 工 
夫 。 我 们 之 前 所 说 的 封装 ， 也 是 把 功能 给 打包 成 规范 的 接口 ， 让 别人 
用 起 来 觉得 简单 。 编程 用 精准 的 机 器 为 大 众 提供 了 一 个 规范 化 的 使 用 
接口 ， 无 论 这 个 接口 是 快速 安全 的 支付 平台 ， 还 是 一 个 简单 快捷 的 订 
票 网 站 。 这 种 封装 和 接口 的 思维 反映 在 社会 生活 的 很 多 方面 。 因 此 ， 
学 习 编 程 也 是 理解 当代 生活 的 一 个 必要 步骤 。 


1.3 ”为 什么 学 Python 


正如 1.2 节 所 说 ， 高 级 语言 的 关键 是 封装 ， 让 程序 编写 变 得 简单 。 
Python 正 是 因为 在 这 一 点 上 做 得 优秀 ， 才 成 为 主流 编程 语言 之 一 。 
Python 的 使 用 相当 广泛 ， 是 Google 的 第 三 大 开发 语言 ， 也 是 Dropbox、 
Quora、Pinterest、 豆 办 等 网 站 主要 使 用 的 语言 。 在 很 多 科研 领域 ， 如 
数学 、 人 工 智 能 、 生 物 信息 、 天 体 物理 等 ，Python 都 应 用 广泛 ， 渐 有 
一 统 天 下 的 势头 。 当 然 ，Python 的 成 功 并 非 一 跳 而 就 。 它 从 诞生 开 
台 ， 已 经 经 历 了 二 三 十 年 的 发 展 。 回 顾 Python 的 历史 ， 我 们 不 但 可 以 
了 解 Python 的 发 展 历 程 ， 还 能 理解 Python 的 哲学 和 理念 。 


Python 的 作者 是 吉 多 . 范 . 罗 苏 姆 (Guido von Rossum) 。 罗 苏 姆 是 
傈 兰 人 。1982 年 ， 他 从 阿姆斯特丹 大 学 (University of Amsterdam) 获 


得 了 数学 和 计算 机 硕士 学 位 。 然 而 ， 尽 管 他 算得 上 是 一 位 数学 家 ， 但 
他 更 加 享受 计算 机 带 来 的 乐趣 。 用 他 的 话说 ， 尽 管 拥有 数学 和 计算 机 
双料 资质 ， 但 他 总 是 趋向 于 做 计算 机 相关 的 工作 ， 并 热衷 于 做 任何 和 
编程 相关 的 活 儿 。 


在 编写 Python 之 前 ， 罗 苏 姆 接触 并 使 用 过 诸如 Pascal、C、 Fortran 
等 语言 。 这 些 语言 的 关注 点 是 让 程序 更 快运 行 。 在 20 世 纪 80 年 代 ， 虽 
然 IBM 和 苹果 已 经 掀起 了 个 人 电脑 浪潮 ， 但 这 些 个 人 电脑 的 配置 在 今 
天 看 来 十 分 低下 。 早 期 的 苹果 电脑 只 有 8MHz 的 CPU 主 频 和 128KB 的 内 
存 ， 稍 微 复 杂 一 点 的 运算 就 能 让 电脑 死机 。 因 此 ， 当 时 编程 的 核心 是 
优化 ， 让 程序 能 够 在 有 限 的 硬件 性 能 下 顺利 运行 。 为 了 增进 效率 ， 程 
序 员 不 得 不 像 计 算 机 一 样 思考 ， 以 便 能 写 出 更 符合 机 器 口味 的 程序 。 
他 们 恨不得 用 手 榨取 计算 机 的 每 一 寸 能 力 。 有 人 甚至 认为 C 语 言 的 指 
针 是 在 浪费 内 存 。 至 于 我 们 现在 编程 经 常 使 用 的 高 级 特征 ， 如 动态 类 
型 、 内 存 自动 管理 、 面 向 对 象 等 ， 在 那个 时 代 只 会 让 电脑 陷入 瘫痪 。 


然而 ， 以 性 能 为 唯一 关注 点 的 编程 方式 让 罗 苏 姆 感到 苦恼 。 即 使 
他 在 脑子 中 清楚 知道 如 何 用 C 语 言 来 实现 一 个 功能 ， 但 整个 编写 过 程 
仍然 需要 耗费 大 量 的 时 间 。 相 对 于 C 语 言 ， 罗 苏 姆 更 喜欢 Shell 实 现 功 
能 的 方式 。UNIX 系 统 的 管理 员 们 常常 用 Shell 去 写 一 些 简单 的 脚本 ， 
以 进行 一 些 系统 维护 的 工作 ， 比 如 定期 备份 、 文 件 系 统管 理 ， 等 等 。 
Shell 可 以 像 胶 水 一 样 ， 将 UNIX 下 的 许多 功能 连接 在 一 起 。 许 多 C 语 言 
下 数 百 行 的 程序 ， 在 Shell 下 只 用 几 行 就 可 以 完成 。 然 而 ，Shell 的 本 质 
是 调用 命令 ， 它 并 不 是 一 个 真正 的 语言 。 比 如 说 ，Shell 数 据 类 型 单 
一 、 运 算 复 杂 等 。 总 之 ，Shell 不 是 一 个 合格 的 通用 程序 语言 。 


罗 苏 姆 希望 有 一 种 通用 程序 语言 ， 既 能 像 C 语 言 那 样 调用 计算 机 
所 有 的 功能 接口 ， 又 能 像 Shell 那 样 轻松 地 编程 。 最 早 让 罗 苏 姆 看 到 希 


望 的 是 ABC 语言 。ABC 语 言 是 由 人 荷兰 的 数学 和 计算 机 研究 所 

(Centrum Wiskunde & Informatica) 开发 的 。 这 家 研究 所 是 罗 苏 姆 上 
班 的 地 方 ， 因 此 罗 苏 姆 正好 能 参与 ABC 语言 的 开发 。ABC 语 言 以 教学 
为 目的 。 与 当时 的 大 部 分 语言 不 同 ，ABC 语 言 的 目标 是 “让 用 户 感觉 更 
好 ”。ABC 语 言 希 望 让 语言 变 得 容易 阅读 、 容 易 使 用 、 容 易 记 忆 和 容易 
学 习 ， 以 此 来 激发 人 们 学 习 编程 的 兴趣 。 比 如 ， 下 面 是 一 段 来 自 维 基 
百科 的 ABC 程序 ， 这 个 程序 用 于 统计 文本 中 出 现 的 词 的 总 数 : 


HOW TO RETURN words document: 
PUT {} IN collection 
FOR line IN document: 
FOR word IN split line: 
IF word not.in collection: 
INSERT word IN collection 


RETURN collection 


HOW TO 用 于 定义 一 个 函数 ，ABC 语 言 使 用 冒号 和 缩 进来 表示 程 
序 块 由 ， 行 尾 没 有 分 号 ，for 和 间 结 构 中 没有 括号 。 上 面 的 程序 读 起 来 
就 像 一 段 自然 的 文字 。 


尽管 已 经 具备 了 良好 的 可 读 性 和 易 用 性 ， 但 ABC 语 言 并 未 流行 起 
来 。 在 当时 ，ABC 语 言 编译 器 需要 比较 高 配置 的 电脑 才能 运行 。 在 那 
个 时 代 ， 高 配置 电脑 是 稀罕 物 ， 其 使 用 者 往往 精通 计算 机 。 这 些 人 更 
在 意 程序 的 效率 ， 而 非 语言 的 学 习 难 度 。 除 了 性 能 ，ABC 语 言 的 设计 
还 存在 一 些 致命 的 问题 : 


。 可 拓展 性 差 。ABC 语 言 不 是 模块 化 语言 。 如 果 想 在 ABC 语言 中 增 
加 功能 ， 比 如 对 图 形 化 的 支持 ， 就 必须 改动 很 多 地 方 。 
。 不 能 直接 进行 输入 输出 。ABC 语 言 不 能 直接 操纵 文件 系统 。 尽 管 
你 可 以 通过 诸如 文本 流 的 方式 导入 数据 ， 但 ABC 语言 无 法 直接 读 
写 文 件 。 输 入 输出 的 困难 对 于 计算 机 语言 来 说 是 致命 的 。 你 能 想 
像 一 个 打 不 开车 门 的 跑车 么 ? 
过 度 革新 。ABC 语 言 用 自然 语言 的 方式 来 表达 程序 的 含义 ， 比 如 
上 面 程序 中 的 HOW TO (如 何 ) 。 然 而 对 于 掌握 了 多 种 语言 的 程 
序 员 来 说 ， 他 们 更 习惯 用 function 或 者 define 来 定义 一 个 孙 数 。 同 
样 ， 程 序 员 也 习惯 了 用 等 号 (=) 来 分 配 变 量 。 革 新 尽管 让 ABC 
语言 显得 特别 ， 但 实际 上 增加 了 程序 员 的 学 习 难 度 。 
传播 困难 。ABC 编 译 器 很 大 ， 必 须 被 保存 在 磁带 (tape) Eo F 
苏 姆 在 学 术 交 流 时 ， 就 必须 用 一 个 大 磁带 来 给 别人 安装 ABC 编 译 
器 。 这 使 得 ABC 语 言 很 难 快速 传播 。 


1989 年 ， 为 了 打发 圣诞 市 假期 ， 罗 苏 姆 开始 瑟 Python 语 言 的 编译 / 
解释 器 。Python 这 个 词 在 英文 中 的 意思 是 蟒蛇 。 但 罗 苏 姆 选择 这 个 名 
字 的 原因 与 蟒蛇 无 天 ， 而 是 来 源 于 他 执 爱 的 一 部 电视 剧 仿 。 他 希望 这 
个 新 的 叫 作 Python 的 语言 ， 能 实现 他 的 理念 。 也 就 是 一 种 在 C 和 Shell 
之 间 ， 功 能 全 面 、 易 学 易 用 、 可 拓展 的 语言 。 罗 苏 姆 作为 一 名 语言 设 
计 爱 好 者 ， 已 经 有 过 设计 语言 的 的 尝试 。 虽 然 上 次 的 语言 设计 并 不 成 
功 ， 但 罗 苏 姆 依然 乐 在 其 中 。 这 一 次 设计 Python 语言 ， 也 不 过 是 他 又 
一 次 寻找 乐趣 的 小 创造 。 


1991 年 ， 第 一 个 Python 编译 /解释 器 诞生 。 它 是 用 C 语 言 实现 的 ， 
能 够 调用 C 语 言 生 成 的 动态 链接 库 包 。 从 一 出 生 ，Python 就 已 经 具有 了 
一 直 保 持 到 现在 的 基本 语法 : 类 (class) — KA (function) 、 异 常 处 


JẸ (exception) 、 包 括 表 (list) 和 词典 (dictionary) 在 内 的 核心 数据 
类 型 ， 以 及 模块 (module) 为 基础 的 拓展 系统 。 


图 1-3 ”最 初 的 Python 图 标 


Python 语法 很 多 来 自 Cc， 但 又 受到 ABC 语言 的 强烈 影响 。Python 像 
ABC 语言 一 样 ， 比 如 用 缩 进 代替 花 括 号 ， 从 而 保证 程序 更 易 读 
(readability) 。 罗 苏 姆 认为 ， 程 序 员 读 代码 的 时 间 要 远 远 多 于 写 代码 
的 时 间 。 强 制 缩 进 能 让 代码 更 清晰 易 读 ， 应 该 予以 保留 。 但 与 ABC 语 
言 不 同 的 是 ， 罗 苏 姆 同样 重视 实用 性 (practicality) 。 在 保证 易 读 性 的 
前 提 下 ，Python 会 乖巧 地 服从 其 他 语言 中 已 有 的 一 些 语法 惯例 。 
Python 用 等 号 赋值 ， 与 多 数 语言 保持 一 致 。 它 使 用 def 来 定义 函数 ， 而 
不 是 像 ABC 语 言 那样 使 用 生僻 的 HOWTO。 罗 苏 姆 认为 ， 如 果 是 “ 常 
识 ” 上 已 确立 的 东西 ， 就 没有 必要 过 度 创 新 。 


Python 还 特别 在 意 可 拓展 性 (extensibility) ， 这 是 罗 苏 姆 实用 主 
义 原则 的 又 一 体现 。Python 可 以 在 多 个 层次 上 拓展 。 从 高 层 上 ， 你 可 
以 引入 其 他 人 编写 的 Python 文 件 ， 来 为 自己 的 代码 拓展 功能 。 如 果 出 
于 性 能 考虑 ， 你 还 可 以 直接 引入 C 和 C++ 语言 编译 出 的 库 。 由 于 C 和 
C++ 语言 在 代码 方面 的 多 年 储备 ，Python 相 当 于 站 在 了 巨人 的 肩膀 
上 。 了 Python 融 像 是 使 用 钢 构 建 房 一 样 ， 先 规定 好 大 的 框架 ， 再 借 着 模 
块 系统 给 程序 员 以 自由 发 挥 的 空间 。 


最 初 的 Python 完全 由 罗 苏 姆 本 人 开发 。 由 于 Python 隐藏 了 许多 机 
器 层面 上 的 细节 ， 并 凸显 出 了 逻辑 层面 的 编程 思考 ， 所 以 这 个 好 用 的 
语言 得 到 了 罗 苏 姆 同事 的 欢迎 。 同 事 们 在 工作 中 乐于 使 用 Python ， 然 
后 向 罗 苏 姆 反馈 使 用 意见 ， 其 中 不 少 人 都 参与 到 语言 的 改进 。 罗 苏 姆 
和 他 的 同事 构成 了 Python 的 核心 团队 ， 他 们 将 自己 大 部 分 的 业余 时 间 
都 奉献 给 了 Python。Python 也 逐渐 从 有 罗 苏 姆 的 同事 圈 传 播 到 其 他 科研 
机 构 ， 慢 慢 用 于 学 术 圈 之 外 的 程序 开发 。 


Python 的 流行 与 计算 机 性 能 的 大 幅 提高 密 不 可 分 。20 世 纪 90 年 代 
初 ， 个 人 计算 机 开始 进入 普通 家 庭 。 喘 特 尔 发 布 了 486 处 理 器 ， 成 为 第 
四 代 处 理 器 的 代表 。1993 年 ， 碳 特 尔 又 推出 了 性 能 更 好 的 奔腾 处 理 
器 。 计 算 机 的 性 能 大 大 提高 。 程 序 员 不 必 再 费 尽心 力 提 高 程序 效率 ， 
开始 越 来 越 天 注 计 算 机 的 易 用 性 。 微 软 发 布 Windows 3.0 开 始 的 一 系列 
视窗 系统 ， 用 方便 的 图 形 化 界面 吸引 了 大 批 普通 用 户 。 那 些 能 快速 生 
产 出 软件 的 语言 成 为 新 的 明星 ， 比 如 运行 在 虚拟 机 上 的 Java。Java 完 
全 基于 面向 对 象 的 编程 范式 ， 能 在 牺牲 性 能 的 代价 下 ， 提 高 程序 的 产 
量 。Python 的 步伐 落后 于 Java， 但 它 的 易 用 性 同样 符合 时 代 潮 流 。 前 
面 说 过 ，ABC 语 言 失败 的 一 个 重要 原因 是 硬件 的 性 能 限制 。 从 这 方面 
来 说 ，Python 要 比 ABC 语 言 笠 运 许多 。 


另 一 个 悄然 发 生 的 改变 是 互联 网 。20 世 纪 90 年 代 还 是 个 人 电脑 的 
时 代 ， 微 软 和 英特尔 挟 PC 以 令 天 下 ， 几 平 垄 断 了 个 人 电脑 市 场 。 当 
时 ， 大 众 化 的 信息 革命 尚未 到 来 ， 但 对 于 近水楼台 的 程序 员 来 说 ， 互 
联网 已 经 是 平日 里 常用 的 工具 。 程 序 员 率先 使 用 互联 网 进行 交流 ， 如 
电子 邮件 和 新 闻 组 。 互 联网 让 信息 交流 成 本 大 大 降低 ， 也 让 有 共同 爱 
好 的 人 能 够 跨越 地 理 限 制 聚合 起 来 。 以 互联 网 的 通信 能 力 为 基础 ， 开 
源 (Open Source) 的 软件 开发 模式 变 得 流行 。 程 序 员 利用 业余 时 间 进 


行 软件 开发 ， 并 开放 源 代 码 。1991 年 ， 林 纳 斯 : 托 瓦 兹 在 comp.os.minix 
新 闻 组 上 发 布 了 Linux 内 核 源 代码 ， 吸 引 了 大 批 程序 员 加 入 开发 工作 ， 
引领 了 开源 运动 的 潮流 。Linux 和 GNU 相 互 合 作 ， 最 终 构成 了 一 个 充 
满 活力 的 开源 平台 。 


罗 苏 姆 本 人 也 是 一 位 开源 先锋 ， 他 维护 了 一 个 邮件 列表 ， 并 把 早 
期 的 Python 用 户 都 放 在 里 面 。 早 期 Python 用 户 就 可 以 通过 邮件 进行 群 
组 交流 。 这 些 用 户 大 多 都 是 程序 员 ， 有 相当 优秀 的 开发 能 力 。 他 们 来 
自 许多 领域 ， 有 不 同 的 背景 ， 对 Python 也 提出 了 各 种 各 样 的 功能 需 
求 。 由 于 Python 相当 开放 ， 又 容易 拓展 ， 所 以 当 一 个 人 不 满足 于 现 有 
功能 时 ， 他 很 容易 对 Python 进行 拓展 或 改造 。 随 后 ， 这 些 用 户 将 改动 
发 给 罗 苏 姆 ， 由 他 决定 是 否 将 新 的 特征 加 入 到 Python 中 人 由。 如 果 代码 
能 被 采纳 ， 将 会 是 极 大 的 采 誉 。 罗 苏 姆 本 人 的 角色 越 来 越 偏重 于 框架 
的 制定 。 如 果 问 题 太 复杂 ， 则 罗 苏 姆 会 选择 绕 过 去 ， 也 就 是 走 捷 径 
(cut the comer) ， 把 其 留 给 社区 的 其 他 人 解决 。 就 连 创建 网 站 已 、 筹 
集 基 金龟 这 样 的 事情 ， 也 有 人 乐于 处 理 。 社 区 日 渐 成 熟 ， 开 发 工作 被 
整个 社区 分 担 。 


Python 的 一 个 理念 是 自 带 电池 (Battery Included) 。 也 就 是 说 ， 
Python 已 经 有 了 功能 丰富 的 模块 。 所 谓 模 块 ， 就 是 别人 已 经 编写 好 的 
Python 程序 ， 能 实现 一 定 的 功能 。 一 个 程序 员 在 编程 时 不 需要 重复 造 
轮子 ， 只 需 引 用 已 有 的 模块 即 可 。 这 些 模块 既 包 括 Python 目 审 的 标准 
库 ， 也 包括 了 标准 库 之 外 的 第 三 方 库 。 这 些 * 电 池 ” 同 样 是 整个 社区 的 
贡献 。Python 的 开发 者 来 自 于 不 同 领 域 ， 他 们 将 不 同 领域 的 优 和 点 带 给 
Python。 Python 标 准 库 中 的 正则 表达 (regular expression) 参考 了 
Perl， 疗 数 式 编程 的 相关 语法 则 参考 了 Lisp 语 言 ， 两 者 都 来 自 于 社区 的 
贡献 。Python 在 简明 的 语法 框架 下 ， 提 供 了 丰富 的 武器 库 。 无 论 是 建 


立 一 个 网 站 ， 制 作 一 个 人 工 智 能 程序 ， 还 是 操纵 一 个 可 穿戴 设备 ， 都 
可 以 借助 已 有 的 库 再 加 上 简短 的 代码 实现 。 这 和 恐怕 是 Python 程序 员 最 
SHO To 


当然 ，Python 也 有 让 人 痛苦 的 地 方 。Python 当 前 最 新 的 版 本 是 3， 

但 Python 3 与 Python 2 不 兼容 。 由 于 很 多 现存 的 代码 是 Python 2 编写 
的 ， 所 以 从 版 本 2 到 版 本 3 的 过 渡 并 不 容易 。 许 多 人 选择 了 继续 使 用 
Python 2。 有 人 开玩笑 说 ，Python 2 的 版 本 号 会 在 未 来 增加 到 
2.7.31415926。 除 了 版 本 选择 上 的 问题 ，Python 的 性 能 也 不 时 被 人 诉 
病 。Python 的 运算 性 能 低 于 C 和 C++， 我 们 会 在 本 书 中 提 及 其 原因 。 尽 
管 Python 也 在 提高 自身 的 性 能 ， 但 性 能 的 差距 会 一 直 存 在。 不 过 从 
Python 的 发 展 历史 来 看 ， 类 似 的 批判 其 实 是 吹 毛 求 疲 。Python 本 身 就 
是 用 性 能 来 交换 易 用 性 ， 走 的 就 是 和 C、C++ 相 反 的 方向 。 说 一 个 足球 
前 锋 的 守门 技术 不 好 ， 并 没有 太 大 的 意义 。 


对 于 初学 编程 的 人 来 说 ， 从 Python 开始 学 习 编 程 的 好 处 很 多 ， 如 
上 面 已 经 提 到 的 语法 简单 和 模块 丰富 。 国 外 许多 大 学 的 计算 机 导论 课 
程 ， 都 开始 选择 Python 作为 课程 语言 ， 替 代 了 过 去 单 用 的 C 或 Java。 但 
如 果 把 Python 当 作 所 谓 的 “最 好 的 语言 ”， 和 希望 学 一 门 Python 就 成 为 “万 
人 敌 ”， 则 是 一 种 幻想 。 每 个 语言 都 有 它 优 秀 的 地 方 ， 但 也 有 各 种 各 样 
的 缺陷 。 一 个 语言 “好 与 不 好 ”的 评判 ， 还 受制 于 平台 、 硬 件 、 时 代 等 
外 部 原因 。 更 进一步 ， 很 多 开发 工作 需要 特定 的 语言 ， 比 如 用 Java 来 
编写 安 卓 应 用 ， 用 Objective-C 或 Swift 来 编写 苹果 应 用 。 无 论 从 哪 一 门 
语言 学 起 ， 最 终 都 不 会 拘泥 于 初学 的 那 门 语言 。 只 有 博彩 众 家 ， 才 能 
让 编程 的 创造 力 自 由 发 挥 。 


1.4 ”最 简单 的 Hello World 


Python 的 安装 很 方便 ， 可 以 参考 本 章 的 附录 A。 运 行 Python 的 方式 
有 两 种 。 如 果 你 想 尝试 少量 程序 ， 并 立即 看 到 结果 ， 则 可 以 通过 命令 
行 (Command Line) 来 运行 Python。 所 谓 的 命令 行 ， 就 是 一 个 等 着 你 
用 键盘 来 打字 的 小 输入 栏 ， 可 以 直接 与 Python 对 话 。 


按照 附录 A 的 方法 启动 命令 行 ， 就 进入 了 Python。 通 常 来 说 ， 命 
令 行 都 会 有 >>> 字 样 的 提示 符 ， 提 醒 你 在 提示 符 后 面 输入 。 你 输入 的 
Python 语句 会 被 Python 的 解释 器 (interpreter) 局 转 化 成 计算 机 指令 。 
我 们 现在 执行 一 个 简单 的 操作 : 让 计算 机 屏幕 显示 出 一 行 字 。 在 命令 
行 提 示 符 后 面 输入 下 列 文 字 ， 并 按键 盘 上 的 回 车 键 (Enter) 确认 : 


>>>print("Hello World!") 


可 以 看 到 ， 屏 幕 上 会 随后 显示 : 


Hello World! 


输入 的 print 是 一 个 水 数 的 名 称 。 鸳 数 有 特定 的 功能 ，print() 遂 数 的 
功能 就 是 在 屏幕 上 打印 出 字符 。 函 数 后 面 有 一 个 括号 ， 里 面 说 明了 想 
要 打印 的 字符 是 "Hello World! "。 括 号 里 的 一 对 双 引 号 并 没有 打印 在 屏 
幕 上 。 这 一 对 双 引 号 的 作用 是 从 print 之 类 的 程序 文本 中 出 标记 出 普通 
字符 ， 以 免 计 算 机 混淆 。 也 可 以 用 一 对 单 引 号 替换 双 引 号 。 


使 用 Python 的 第 二 种 方式 是 写 一 个 程序 文件 (Program File) o 
Python 的 程序 文件 以 .py 为 后 缀 ， 它 可 以 用 任何 文本 编辑 器 来 创建 和 编 
写 。 附 录 A 中 说 明了 不 同 操作 系统 下 常用 的 文本 编辑 器 。 创 建文 件 
hello.py， 写 入 如 下 内 容 ， 并 保存 : 


print("Hello World!") 


可 以 看 到 ， 这 里 的 程序 内 容 和 用 命令 行 时 一 模 一 样 。 与 命令 行 相 
比 ， 程 序 文件 适用 于 编写 和 保存 量 比较 大 的 程序 。 


运行 程序 文件 hello.py， 可 以 看 到 Python 同样 在 屏幕 上 打印 出 了 
Hello World!。 程 序 文件 的 内 容 和 命令 行 里 敲 入 的 内 容 一 模 一 样 ， 产 生 
的 效果 也 一 样 。 与 命令 行 直接 输入 程序 相 比 ， 程 序 文件 更 容易 保存 和 
更 改 ， 所 以 常用 于 编写 大 量程 序 。 


程序 文件 的 另 一 个 好 处 是 可 以 加 入 注释 (comments) 。 注 释 是 一 
些 文字 ， 用 来 解释 某 一 段 程序 ， 也 方便 其 他 程序 员 了 解 这 段 程序 。 所 
以 ， 注 释 的 内 容 并 不 会 被 当 作 程序 执行 。 在 Python 的 程序 文件 中 ， 每 
一 行 中 从 # 开 始 的 文字 都 是 注释 ， 我 们 可 以 给 hello.py 加 注释 : 


print("Hello World!") # display text on the screen 


如 果 注 释 的 内 容 较 多 ， 在 一 行 里 面 放 不 下 ， 那 么 可 以 用 多 行 注 释 
(multiline comments) 的 方法 : 


Author: Vamei 


Function: display text on the screen 


print('Hello World!') 


多 行 注 释 的 标志 符 是 三 个 连续 的 双 引 号 。 多 行 注 释 也 可 以 使 用 三 
个 连续 的 单 引 号 。 两 组 引号 之 间 的 内 容 ， 就 是 多 行 注释 的 内 容 。 


无 论 是 想 要 打印 的 字符 ， 还 是 用 于 注释 的 文字 ， 都 可 以 是 中 文 。 
如 果 在 Python 2 中 使 用 中 文 ， 则 需要 在 程序 开始 之 前 加 上 一 行 编码 信 
息 ， 以 说 明 程 序 文件 中 使 用 了 支持 中 文 的 utf-8 编 码 。 在 Python 3 中 不 需 
要 这 一 行 信息 。 


# - - coding: utf-8 - - 


print(" 你 好 ， 世 界 ! ") # 在 屏幕 上 显示 文字 


就 这 样 ， 我 们 写 出 了 一 个 非常 简单 的 Python 程序 。 不 要 小 看 了 这 
个 程序 。 在 实现 这 个 程序 的 过 程 中 ， 你 的 计算 机 进行 了 复杂 的 工作 。 
它 读 取 了 程序 文件 ， 在 内 存 中 分 配 了 空间 ， 进 行 了 许多 运算 和 控制 ， 
最 终 才 控制 屏幕 的 显 像 原 件 ， 让 它 显 示 出 一 串 字符 。 这 个 程序 的 顺利 
运行 ， 说 明 计 算 机 硬件 、 操 作 系统 和 语言 编译 器 都 已 经 安装 并 设置 


好 。 因 此 ， 程 序 员 编程 的 第 一 个 任务 ， 通 常 都 是 在 屏幕 上 打印 出 Hello 
World(3。 第 一 次 遇见 Python 的 世界 ， 就 用 Hello World 和 它 打 声 招呼 
吧 。 


附录 A Python 的 安装 与 运行 
1. 官方 版 本 安装 


1) Mac 


Mac 系 统 上 已 经 预 装 了 Python ， 可 以 直接 使 用 。 如 果 想 要 使 用 其 
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(Terminal) ， 在 命令 行 提 示 符 后 输入 下 面 命令 后 ， 将 进入 Python 的 可 
以 互动 的 命令 行 : 


$python 


上 面 输入 的 python 通 常 是 一 个 软 链接 ， 指 向 某 个 版 本 的 Python 命 
令 ， 如 3.5 版 本 。 如 果 相 应 版 本 已 经 安装 ， 那 么 可 以 用 下 面 的 方式 来 运 
íT: 


$python3.5 


终端 会 出 现 Python 的 相关 信息 ， 如 Python 的 版 本 号 ， 然 后 就 会 出 
现 Python 的 命令 行 提示 符 >>>。 如 果 想 要 退出 Python， 则 输入 : 


>>>exit() 


如 果 想 要 运行 当前 目录 下 的 某 个 Python 程 序 文件 ， 那 么 在 python 
或 python3 后 面 加 上 文件 的 名 字 : 


$python hello.py 


如 果 文 件 不 在 当前 目录 下 ， 那 么 需要 说 明文 件 的 完整 路 径 ， 如 


$python /home/vamei/hello. py 


我 们 还 可 以 把 Python 程序 hello.py 改 成 一 个 可 执行 的 脚本 。 只 需 在 
hello.py 的 第 一 行 加 上 所 要 使 用 的 Python 解释 器 : 


#!/usr/bin/env python 


在 终端 中 ， 把 hello.py 的 权限 改 为 可 执行 : 


$chmod 755 hello.py 


然后 在 命令 行 中 ， 输 入 程序 文件 的 名 字 ， 就 可 以 直接 使 用 规定 的 
解释 器 运行 了 : 


$./hello.py 


如 果 hello.py 在 默认 路 径 下 ， 那 么 系统 就 可 以 自动 搜索 到 这 个 可 执 
行文 件 ， 就 可 以 在 任何 路 径 下 运行 这 个 文件 了 : 


$hello.py 


2) Linux 操 作 系 统 


Linux 系 统 与 Mac 系 统 比较 类 似 ， 大 多 也 预 革 了 Python。 很 多 Linux 
系统 下 都 提供 了 类 似 于 Homebrew 的 软件 管理 器 ， 例 如 在 Ubuntu 下 使 用 


下 面 命令 安装 : 


$sudo apt-get install python 


在 Linux 下 ，Python 的 使 用 和 运行 方式 也 和 Mac 系 统 下 类 似 ， 这 里 
TAAR, 


3) Windows 操 作 系 统 


对 于 Windows 操 作 系 统 来 说 ， 需 要 到 Python 的 官方 网 站 0) 下 载 安 
装 包 。 如 果 无 法 访问 Python 的 官网 ， 那 么 可 以 通过 搜索 引擎 查找 
“python Windows 下 载 ” 这 样 的 关键 字 ， 来 寻找 其 他 的 下 载 源 。 安 装 过 
程 与 安装 其 他 Windows 软 件 类 似 。 在 安装 界面 中 ， 选 择 Customize 来 个 
性 化 安装 ， 除 了 选择 Python 的 各 个 组 件 外 ， 还 要 勾 选 : 


Add python.exe to Path 


安装 好 之 后 ， 就 可 以 打开 Windows 的 命令 行 ， 像 在 Mac 中 一 样 使 
用 Python 了 。 


2。 其 他 Python 版 本 


官方 版 本 的 Python 主要 提供 了 编译 /解释 器 功能 。 其 他 一 些 非 官方 
版 本 则 有 更 加 丰富 的 功能 和 界面 ， 比 如 更 加 友好 的 图 形 化 界面 、 一 个 
针对 Python 的 文本 编辑 器 ， 或 者 是 一 个 更 容易 使 用 的 模块 管理 系统 ， 
方便 你 找到 各 种 拓展 模块 等 。 在 非 官方 的 Python 中 ， 最 常用 的 有 下 面 
两 个 : 


1) Anaconda. 
2) Enthought Python Distribution (EPD) (2) 


相对 于 官方 版 本 的 Python 来 说 ， 这 两 个 版 本 都 更 容易 安装 和 使 
用 。 在 模块 管理 系统 的 帮助 下 ， 程 序 员 还 可 以 避免 模块 安装 方 面 的 恼 
人 问题 。 所 以 非常 推荐 初学 者 使 用 。Anaconda 是 免费 的 ，EPD 则 对 于 
学 生 和 科研 人 员 免 费 。 由 于 提供 了 图 形 化 界面 ， 因 此 它们 的 使 用 方法 
也 相当 直观 。 我 强烈 建议 初学 者 从 这 两 个 版 本 中 挑选 一 个 使 用 。 有 具体 
用 法 可 以 参考 官方 文档 ， 这 里 不 再 袭 述 。 


附录 B virtualenv 


一 台 计 算 机 中 可 以 安装 多 个 版 本 的 Python， 而 使 用 virtualenv 则 可 
给 每 个 版 本 的 Python 创 造 一 个 虚拟 环境 。 下面 就 使 用 Python 附 带 的 


pip4) 来 安装 virtualenv: 


$pip install virtualenv 


你 可 以 为 计算 机 中 某 个 版 本 的 Python 创 建 一 个 虚拟 空间 ， 比 如 : 


$virtualenv -p /usr/bin/python3.5 myenv 


上 面 的 命令 中 ，/usr/bin/python3.5 是 解释 器 所 在 的 位 置 ，myenv 是 
新 建 的 虚拟 环境 的 名 称 。 下 面 命 令 可 开始 使 用 myenv 这 个 虚拟 环境 : 


$source myenv/bin/activate 


使 用 下 面 命 令 可 退出 虚拟 环境 : 


$deactivate 


(了 有) 很 多 语言 使 用 {} 来 表示 程序 块 ， 比 如 C、Java 和 JavaScript。 


(2) 这 部 电视 剧 是 《 蒙 提 : 派 森 的 飞行 马戏 团 》 (Monty Python's Flying Circus) 。 这 部 英国 
喜剧 在 当时 广 受 欢迎 。 蒙 提 : 派 森 是 主创 剧团 的 名 字 。Python 即 来 自 这 里 的 “ 派 森 ”。 


(3) 即 .so 文件 。 


(4) 罗 苏 姆 充当 了 社区 的 决策 者 。 因 此 ， 他 被 称 为 仁慈 的 独裁 者 (Benevolent Dictator For 
Life) 。 在 Python 早期 ， 不 少 Python 追随 者 担心 罗 苏 姆 的 生命 。 他 们 甚至 热情 讨论 : 如 果 罗 苏 
姆 出 了 车 祸 ， Python 会 怎样 。 

(5) python.org 


(6) Python Software Foundation 


(Z) Python 的 解释 器 是 一 个 运行 着 的 程序 。 它 可 以 把 Python 语句 一 行 一 行 地 直接 转译 运 


1To 
(8) Hello World! 之 所 以 流行 ， 是 因为 它 被 经 典 编程 教材 《C 程 序 设计 语言 》 用 作 例 子 。 
(9) Homebrew 是 Mac 下 的 软件 包 管 理工 具 ， 其 官方 网 址 为 : http://brew.sh/。 
(10) Python 官网 : www.python.org. 
(11) Anaconda 官 网 : www.continuum.ioo 
(12) EPD 官 网 : www.enthought.com/products/epd/o 
(13) 将 在 第 3 章 的 附录 部 分 进一步 讲解 pip 的 使 用 。 


第 2 章 ” 先 做 键盘 侠 


2.1 计算 机 会 算术 
2.2 ”计算 机 记性 好 
2.3 ”计算 机 懂 选 择 
2.4 ”计算 机 能 循环 
附录 A ”小 练习 


附录 B ”代码 规范 


本 章 将 讲述 运算 、 变 量 、 选 择 结构 和 循环 结构 。 常 见 的 高 级 语言 
都 提供 这 些 语法 。 利 用 这 些 语法 ， 我 们 也 能 利用 计算 机 实现 一 些小 型 
的 程序 ， 从 而 让 编程 立即 应 用 于 生活 。 例 如 ， 平 时 做 数学 运算 ， 可 以 
习惯 性 地 用 Python 的 命令 行 做 计算 器 。 敲 几 行程 序 ， 实 现 一 个 小 功 
能 ， 就 已 经 能 让 人 享受 编程 的 乐趣 了 。 


2.1 ”计算 机 会 算术 
1. 数值 运算 


既然 名 为 “计算 机 ”， 那 么 数学 计算 自然 是 计算 机 的 基本 功 。 
Python 中 的 运算 功能 简单 且 符合 直觉 。 打 开 Python 命 令 行 ， 输 入 如 下 
的 数值 运算 ， 了 立刻 就 能 进行 运算 : 


>>>1 + 9 # 加 法 。 结 果 为 10 

>>>1.3 - 4 # 减法 。 结 果 为 -2.7 

>>>3°5 # 乘法 。 结 果 为 15 

>>>4.5/1.5 H 除法 。 结 果 为 3.0 

>>>3°*2 # 乘 方 ， 即 求 3 的 二 次 方 。 结 果 为 9 
>>>10%3 # 求 余数 ， 就 求 10 除 以 3 的 余数 。 结 果 为 1 


有 了 这 些 基础 运算 后 ， 我 们 就 可 以 像 用 一 个 计算 器 一 样 使 用 
Python。 以 买房 为 例 。 一 套房 产 的 价格 为 86 万 元 ， 购 买 时 需要 付 15% 


的 税 ， 此 外 还 要 向 银行 支付 20% 的 首付 。 那 么 我 们 可 以 用 下 面 代码 计 
算出 需要 准备 的 现金 : 


>>>860000 (0.15 + 0.2) # 结果 为 3901000.0， 即 30 万 1 千 元 


除了 常见 的 数值 运算 ， 字 符 串 也 能 进行 加 法 运算 。 其 效果 是 把 两 
个 字符 串 连 成 一 个 字符 串 : 


>>>"Vamei say:" + "Hello World" # 连接 成 "Vamei say:Hello 


World!" 


一 个 字符 串 还 能 和 一 个 整数 进行 乘法 运算 : 


>>>"Vamei" 2 # 结果 为 "VameiVamei" 
一 个 字符 串 与 一 个 整数 mn 相 乘 的 话 ， 会 把 该 字符 串 重 复 m 次 。 
SS oO. 
2. 逻辑 运算 


除了 进行 数值 运算 外 ， 计 算 机 还 能 进行 逻辑 运算 。 如 果 玩 过 杀人 
游戏 ， 或 者 喜欢 侦探 小 说 ， 那 么 就 很 容易 理解 逻辑 。 就 好 像 侦探 福 尔 


摩 斯 一 样 ， 我 们 用 逻辑 去 判断 一 个 说 法 的 真 假 。 一 个 假设 性 的 说 法 被 
称 为 命题 ， 比 如 说 “玩家 甲 是 杀手 ”。 逻 辑 的 任务 就 是 找 出 命题 的 真 
假 。 


第 1 章 中 已 经 提 到 ， 计 算 机 采用 了 二 进 制 ， 即 用 0 和 1 来 记录 数据。 
计算 机 之 所 以 采用 二 进 制 ， 是 有 技术 上 的 原因 。 许 多 组 成 计算 机 的 原 
件 ， 都 只 能 表达 两 个 状态 ， 比 如 电路 的 开 和 关 、 或 者 电压 的 高 和 低 。 
这 样 造 出 的 系统 也 相对 稳定 。 如 果 使 用 十 进 制 ， 那 么 某 些 计算 机 原件 
就 要 有 10 个 状态 ， 比 如 把 电压 分 成 十 个 档 。 那 样 的 话 ， 系 统 就 会 变 得 
复杂 且 容 易 出 错 。 在 二 进 制 体系 下 ， 可 以 用 1 和 0 来 代表 * 真 ”? 和 * 假 ”两 
种 状态 。 在 Python 中 ， 我 们 使 用 True 和 False 两 个 关键 字 来 表示 真 假 。 
True 和 False 这 样 的 数据 被 称 为 布尔 值 (Boolean) 。 


有 的 时 候 ， 我 们 需要 进一步 的 逻辑 运算 ， 从 而 判断 复杂 命题 的 真 
假 。 比 如 第 一 轮 时 我 知道 了 “玩家 甲 不 是 杀手 ”为 真 ， 第 二 轮 我 知道 了 
“玩家 乙 不 是 杀手 ”也 是 真 。 那 么 在 第 三 轮 时 ， 如 果 有 人 说 “玩家 甲 不 是 
杀手 ， 而 且 玩 家 乙 也 不 是 杀手 ”， 那 么 这 个 人 就 是 在 说 真 话 。 用 “而 且 ” 
连接 起 来 的 两 个 命题 分 别 为 真 ， 那 么 整体 命题 就 是 真 。 无 形 中 ， 我 们 
进行 了 一 次 “与 ”的 逻辑 运算 。 在 “与 ?运算 中 ， 两 个 子 命题 必须 都 为 真 
时 ， 用 “与 ”连接 起 来 的 复合 命题 才 是 真 。“ 与 ”运算 就 像 是 接连 的 两 座 
桥 ， 必 须 两 座 桥 都 通畅 ， 才 能 过 河 ， 如 图 2-1 所 示 。 以 “中 国 在 亚洲 ， 
而 且 英 国 也 在 亚洲 ”这 个 命题 为 例 。“ 英 国 在 亚洲 "这 个 命题 是 假 的 ， 所 
以 整个 命题 就 是 假 的 。 在 Python 中 ， 我 们 用 and 来 表示 “与 ”的 逻辑 运 
算 。 


>>>True and True # 结果 为 True 


>>>False and True # 结果 为 False 


>>>False and False # 结果 为 False 


人 人/ 


IN - 


图 2-1 “与 ?和 “或 "运算 


我 们 还 可 以 用 “或 者 ”把 两 个 命题 复合 在 一 起 。 与 吊 吊 允 人 的 “而 
BRAM, “或 者 ”显得 更 加 谦逊 。 比 如 在 “中 国 在 亚洲 ， 或 者 英国 
在 亚洲 "这 个 说 法 中 ， 说 话 的 人 就 给 自己 留 了 余地 。 由 于 这 句 话 的 前 一 
半 是 对 的 ， 所 以 整个 命题 就 是 真 的 。“ 或 者 "就 对 应 了 “或 "逻辑 运算 。 
在 “或 运算 中 ， 只 要 有 一 个 命题 为 真 ， 那 么 用 “或 ”连接 起 来 的 复合 命 
题 就 是 真 。“ 或 ”运算 就 像 并 行 跨 过 河 的 两 座 桥 ， 任 意 一 座 通畅 ， 就 能 
让 行人 过 河 。 


Python 用 or 来 进行 “或 ”的 逻辑 运算 。 


>>>True or True # 结果 为 True 
>>>True or False # 结果 为 True 


>>>False or False # 结果 为 False 


最 后 ， 还 有 一 种 称 为 非 的 逻辑 运算 ， 其 实 就 是 对 一 个 命题 求 反 。 
比如 “ 甲 不 是 杀手 ”为 真 ， 那 么 “ 甲 是 杀手 ”这 个 反 命题 就 是 假 。Python 
使 用 not 这 个 关键 字 来 表示 非 运 算 ， 比 如 : 


>>>not True # 结果 为 False 


3. 判断 表达 式 


上 面 的 逻辑 运算 看 起 来 似乎 只 是 些 生 活 经 验 ， 完 全 不 需要 计算 机 
这 样 的 复杂 工具 。 加 入 判断 表达 式 之 后 ， 逻 辑 运算 方 能 真正 显示 出 它 
的 威力 。 


判断 表达 式 其 实 就 是 用 数学 形式 写 出 来 的 命题 。 比 如 “1 等 于 1”， 
写 在 Python 里 就 是 : 


>>>1 == 1 # 结果 为 True 


符号 == 表 示 了 相等 的 关系。 此 外 ， 还 有 其 他 的 判断 运算 符 : 


>>>8.0 != 8.0 # 1=， 不 等 于 


>>>4 < 5 # <， 小 于 

>>>3 <= 3 # <=, 小 于 或 等 于 
>>>4 > 5 # >, 大 于 

>>>4 >= 0 # >=， 大 于 等 于 


这 些 判断 表达 式 都 很 简单 。 即 使 不 借助 Python， 也 能 很 快 在 头脑 
中 得 出 它们 的 真 假 。 但 如 果 把 数值 运算 、 逻 辑 运算 和 判断 表达 式 放 在 
一 起 ， 就 能 体现 出 计算 机 的 优势 了 。 还 是 用 房贷 的 例子 ， 房 产 价格 86 
万 元 ， 和 税率 15%， 首 付 20%。 假 如 我 手 里 有 40 万 元 的 现金 。 出 于 税务 
原因 ， 我 还 希望 自己 付 的 税 款 低 于 13 万 元 ， 那 么 是 否 还 可 以 买 这 套房 
子 ? 这 个 问题 可 以 借用 Python 进行 计算 。 


>>>860000 (0.15 + 0.2) <= 400000 and 860000°0.15 < 130000 
答案 是 True 》 可 以 买房 ! 


4. 运算 优先 级 


如 果 一 个 表达 式 中 出 现 多 个 运算 符 ， 融 要 考虑 运算 优先 级 的 问 
题 。 不 同 的 运算 符号 优先 级 不 同 。 运 算 符 可 以 按照 优先 级 先后 归 为 : 


乘 方 : ” 


乘除 : / 

加 减 : + 

判断 : == >>= <<= 
sa: ! and or 


如 果 是 相同 优先 级 的 运算 符 ， 那 么 Python 会 按照 从 左 向 右 的 顺序 
行 运算 ， 比 如 : 


>>>4 +2-1 # 先 执 行 加 法 ， 再 执行 减法 。 结 果 为 5 


如 果 有 优先 级 高 的 运算 符 ，Python 会 打破 从 左 向 右 的 默认 次 序 ， 
先 执行 优先 级 高 的 运算 ， 比 如 : 


>>>4 + 2 2 # 先 执 行 乘法 ， 再 执行 加 法 。 结 果 为 8 


括号 会 打破 运算 优先 级 。 如 果 有 括号 存在 ， 会 先进 行 括号 中 的 运 


算 : 


>>>(4 + 2) 2 # 先 执行 加 法 ， 再 执行 乘法 。 结 果 为 12 


2.2 ”计算 机 记性 好 
1。 变 量 革命 


上 面 的 运算 中 出 现 的 数据 ， 无 论 是 1 和 5.2 这 样 的 数值 ， 还 是 True 
和 False 这 样 的 布尔 值 ， 都 会 在 运算 结束 后 消失 。 有 了 时， 我 们 想 把 数据 
存储 到 存储 器 中 ， 以 便 在 后 面 的 程序 中 重复 使 用 。 计 算 机 存储 器 中 的 
每 个 存储 单元 都 有 一 个 地 址 ， 就 像 是 门牌 号 。 我 们 可 以 把 数据 存 入 特 
定 门牌 号 的 隔 间 ， 然 后 通过 门牌 号 来 提取 之 前 存储 的 数据 。 


但 用 内 存 地 址 来 为 存储 的 地 址 建 索 引 ， 其 实 并 不 方便 : 


。 内 存 地 址 相当 宛 长 ， 难 以 记忆 。 

。 每 个 地 址 对 应 的 存储 空间 大 小 固定 ， 难 以 适应 类 型 多 变 的 数据 。 

。 对 某 个 地 址 进行 操作 前 ， 并 不 知道 该 地 址 的 存储 空间 是 否 已 经 被 
占用 。 


随 着 编程 语言 的 发 展 ， 开 始 有 了 用 变量 的 方式 来 存储 数据 。 变 量 
和 内 存 地 址 类 似 ， 也 起 到 了 索引 数据 的 功能 。 新 建 变量 时 ， 计 算 机 在 
空 朵 的 内 存 中 开辟 存储 空间 ， 用 来 存储 数据 。 和 内 存 地址 不 同 的 是 ， 
根据 变量 的 类 型 ， 分 配 的 存储 空间 会 有 大 小 变化 。 程 序 员 给 变量 起 一 
个 变量 名 ， 在 程序 中 作为 该 变量 空间 的 索引 。 数 据 交 给 变量 ， 然 后 在 
需要 的 时 候 通过 变量 的 名 字 来 提取 数据 。 比 如 下 面 的 Python 程序 : 


v = "Vivian" 


print(v) #FT EDA "Vivian" 


在 上 面 的 程序 中 ， 我 们 把 数值 10 交 给 变量 v 保 存 ， 这 个 过 程 称 为 赋 
值 (Assignment) 。Python 中 用 等 号 = 来 表示 赋值 。 借 助 赋值 ， 一 个 变 
量 就 建立 了 。 从 硬件 的 角度 来 看 ， 给 变量 赋值 的 过 程 ， 就 是 把 数据 存 
入 内 存 的 过 程 。 变 量 就 像 能 装 数据 的 小 房间 ， 变 量 名 是 门牌 号 。 赋 值 
操作 是 让 某 个 客人 前 往 该 房间 。 


“i 上 Vivian 入 住 到 v 字 号 房 。” 

在 随后 的 加 法 运算 中 ， 我 们 通过 变量 名 v 取 出 了 变量 所 包含 的 数 
据 ， 然 后 通过 print0 打 印 出 来 。 变 量 名 是 从 内 存 中 找到 对 应 数据 的 线 
索 。 有 了 存储 功能 ， 计 算 机 就 不 会 犯 * 失 忆 症 ”> 了。 

“vy 字号 房 住 的 是 谁 ? ” 

“是 Vivian 呀 。” 


酒店 的 房间 会 有 不 同 的 客人 入 住 或 离开 。 变 量 也 是 如 此 。 我 们 可 
以 给 一 个 变量 赋 其 他 的 值 。 这 样 ， 房 间 里 的 客人 就 变 了 。 


v = "Tom" 


print(v) #}JENHE "Tom" 


在 计算 机 编程 时 ， 经 常设 置 许多 变量 ， 让 每 个 变量 存储 不 同 功能 
的 数据。 例如 ， 电 脑 洲 戏 中 可 能 记录 玩家 拥有 的 不 同 资产 的 数目 ， 残 
可 以 用 不 同 的 变量 记录 不 同 的 资源 。 


gold = 100 # 100 个 金子 
wood = 20 # 20 个 木材 


wheat = 29 # 29 个 小 麦 


在 游戏 过 程 中 ， 可 以 根据 情况 增加 或 者 减少 某 种 资产。 例如 ， 玩 
家 选择 伐木 ， 就 增加 5 个 木材 。 这 个 时 候 ， 就 可 以 对 相应 变量 执行 加 5 
的 操作 。 


wood = wood + 5 


print (wood) # 打印 出 25 


计算 机 先 执 行 赋值 符号 右边 的 运算 。 原 有 的 变量 值 加 5， 再 赋予 给 
同一 个 变量 。 在 游戏 进行 的 整个 过 程 中 ， 变 量 wood 起 到 了 追踪 木材 数 
据 的 作用 。 玩 家 的 资产 数据 被 妥 善 地 人 存储 起 来 。 


变量 名 直接 参与 运算 ， 这 是 迈 向 抽象 思维 的 第 一 步 。 在 数学 上 ， 
用 符号 来 代替 数值 的 做 法 称 为 代数 。 今 天 的 很 多 中 学 生 都 会 列 出 代数 
方程 ， 来 解决 “ 鸡 锡 同 笼 ” 之 类 的 数学 问题 。 但 在 古代 ， 代 数 是 相当 先 
进 的 数学 。 欧 洲 人 从 阿拉 伯 人 那里 学 到 了 先进 的 代数 ， 利 用 代数 的 符 
号 系统 ， 摆 脱 了 具体 数值 的 桂 梅 ， 更 加 专注 于 逻辑 和 符号 之 间 的 天 
系 。 在 代数 的 基础 上 发 展 出 近代 数学 ， 为 近代 的 科技 爆炸 打下 了 基 
础 。 变 量 也 让 编程 有 了 更 高 一 层 的 抽象 能 力 。 


变量 提供 的 符号 化 表达 方式 ， 是 实现 代码 复 用 的 第 一 步 。 比 如 之 
前 计算 购房 所 需 现金 的 代码 : 


860000 (0.15 + 0.2) 


当 我 们 同时 看 多 套房 时 ，860000 这 个 价格 会 不 断 变动 。 为 了 方 
便 ， 我 们 可 以 把 程序 写成 : 


total = 860000 


requirement = total’(0.15 + 0.2) 


print(requirement ) # 打印 结果 301000 .0 


这 样 ， 每 次 在 使 用 程序 时 ， 只 需 更 改 860000 这 个 数值 就 可 以 了 。 
当然 ， 我 们 还 会 在 未 来 看 到 更 多 的 复 用 代码 的 方式 。 但 变量 这 种 用 抽 
象 符号 代替 具体 数值 的 思维 ， 具 有 代表 性 的 意义 。 


2。 变 量 的 类 型 


数据 可 能 有 很 多 不 同 的 类 型 ， 例 如 5 这 样 的 整数 、5.9 这 样 的 浮 点 
数 、True 和 False 这 样 的 布尔 值 ， 还 有 第 1 章 中 见 过 的 字符 串 "Hello 
World!"。 在 Python 中 ， 我 们 可 以 把 各 种 类 型 的 数据 赋予 给 同一 个 变 
量 。 比 如 : 


var_integer = 5 


print(var_integer ) # a 存储 的 内 容 为 整数 5 
var_string = "Hello World!" 
print(var_string) # a 存储 的 内 容 变 成 字符 串 "Hello world!" 


可 以 看 到 ， 后 赋予 给 变量 的 值 蔡 换 了 变量 原来 的 值 。Python 能 
由 改变 变量 类 型 的 特征 被 称 为 动态 类 型 【Dynamic Typing) 。 并 不 是 
所 有 的 语言 都 支持 动态 类 型 。 在 静态 类 型 (Static Typing) 的 语言 中 ， 
变量 有 事先 说 明 好 的 类 型 。 特 定 类 型 的 数据 必须 存 入 特定 类 型 的 变 
量 。 相 比 于 静态 类 型 ， 动 态 类 型 显得 更 加 灵活 便利 。 


即使 是 可 以 自由 改变 ，Python 的 变量 本 身 还 是 有 类 型 的 。 我 们 可 
以 用 type0 这 一 函数 来 查看 变量 的 类 型 。 比 如 说 : 


var_integer = 10 


print(type(var_integer ) ) 


输出 结果 是 中: 


<class 'int'> 


int 是 整数 integer 的 简写 。 除 此 之 外 ， 还 会 有 浮 点 数 (Float) 、 字 
符 串 《String， 简 写 为 st) 、 布 尔 值 (Boolean， 简 写 为 bool) 。 常 见 


的 类 型 包括 : 


>>>a = 100 # 整 型 

>>>a = 100.0 # FAH 

>>>a = 'abc' # 字符 串 。 也 可 以 使 用 双 引 号 "abc" 标 记 字 符 串 。 
>>>a = True # 布尔 值 


计算 机 需要 用 不 同 的 方式 来 存储 不 同 的 类 型 。 整 数 可 以 直接 用 二 
进 制 的 数字 表示 ， 浮 点 数 却 用 额外 记录 小 数 点 的 位 置 。 每 种 数据 所 需 
的 存储 空间 也 不 同 。 计 算 机 的 存储 空间 以 位 (bit) 为 单位 ， 每 一 位 能 
存储 一 个 0 或 1 的 数字 。 为 了 记录 一 个 布尔 值 ， 我 们 只 需 让 1 代表 真 值 ， 
0 代表 假 值 就 可 以 。 所 以 布尔 值 的 存储 只 需要 1 位 。 对 于 整数 4 来 说 ， 变 
换 成 二 进 制 位 100。 为 了 存储 它 ， 存 储 空间 至 少 要 有 3 位 ， 分 别 记录 1、 
0. 0o 


为 了 效率 和 实用 性 ， 计 算 机 在 内 存 中 必须 要 分 类 型 存储 。 静 态 类 
型 语言 中 ， 新 建 变量 必须 说 明 类 型 ， 就 是 这 个 道理 。 动 态 类 型 的 语言 
看 起 来 不 需要 说 明 类 型 ， 但 其 实 是 把 区 分 类 型 的 工作 交 给 解释 器 。 当 
我 们 更 改变 量 的 值 时 ，Python 解 释 器 也 在 努力 工作 ， 自 动 分 辨 出 新 数 
据 的 类 型 ， 再 为 数据 开辟 相应 类 型 的 内 存 空间 。Python 解 释 器 贴心 的 
服务 让 编程 更 加 方便 ， 但 也 把 计算 机 的 一 部 分 能 力 用 于 支持 动态 类 型 
上 。 这 也 是 Python 的 速度 不 如 C 语 言 等 静态 类 型 语言 的 一 个 原因 。 


3。 序 列 


Python 中 一 些 类 型 的 变量 ， 能 像 一 个 容器 一 样 ， 收 纳 多 个 数据 。 
本 小 节 讲 的 序列 (Sequence) 和 下 一 小 节 的 词典 (Dictionary) ， 都 是 
容器 型 变量 。 我 们 先 从 序列 说 起 。 就 好 像 一 列 排 好 队 的 士兵 ， 序 列 是 
有 顺序 的 数据 集合 。 序 列 包 含 的 一 个 数据 被 称 为 序列 的 一 个 元 素 
(element) 。 序 列 可 以 包含 一 个 或 多 个 元 素 ， 也 可 以 是 完全 没有 任何 
元 素 的 空 序列 。 


序列 有 两 种 ,元 组 (Tuple) 和 列表 (List) 。 两 者 的 主要 区 别 在 
于 ， 一 旦 建立 ， 元 组 的 各 个 元 素 不 可 再 变更 ， 而 列表 元 素 可 以 变更 
所 以 ， 元 组 看 起 来 就 像 一 种 特殊 的 表 ， 有 固定 的 数据 。 因 此 ， 有 的 翻 
译 也 把 元 组 称 为 “ 定 值 表 ”。 创 建 元 组 和 表 的 方式 如 下 : 


>>>example_tuple = (2, 1.3, "love", 5.6, 9, 12, False) # 一 个 
元 组 

>>>example_list= [True, 5, "smile"] # —t 
列表 

>>>type(example_tuple) # 结果 为 'tuple' 

>>>type(example_list) # 结果 为 "List' 


可 以 看 到 ， 同 一 个 序列 可 以 包含 不 同类 型 的 元 素 ， 这 也 是 Python 
动态 类 型 的 一 还 有 ， 序 列 的 元 素 不 仅 可 以 是 基本 类 型 的 数 
据 ， 还 可 以 是 另外 一 个 序列 。 


>>>nest_list = [1,[3,4,5]] # IRPREA— NIR 


由 于 元 组 不 能 改变 数据 ， 所 以 很 少 会 建立 一 个 空 的 元 组 。 而 序列 
可 以 增加 和 修改 元 素 ， 所 以 Python 程序 中 经 常会 建立 空 表 : 


>>>empty_list = [] # 空 列表 


既然 序列 也 用 于 储存 数据 ， 那 么 我 们 不 免 要 读 取 序列 中 的 数据 。 
序列 中 的 元 素 是 有 序 排列 ， 所 以 可 以 根据 每 个 元 素 中 的 位 置 来 找到 对 
应 元 素 。 序 列 元 素 的 位 置 索 引 称 为 下 标 (Index) 。Python 中 序列 的 下 
标 从 0 开始 ， 即 第 一 个 元 素 的 对 应 下 标 为 0。 这 一 规定 有 历史 原因 在 里 
面 ， 是 为 了 和 经 典 的 C 语 言 保 持 一 致 。 我 们 尝试 引用 序列 中 的 元 素 : 


>>>example_tuple[0] # 结果 为 2 
>>>example_list[2] # 结果 为 'smile' 


>>>nest_list[1][2] # 结果 为 5 


表 的 数据 可 变更 ， 因 此 可 以 对 单个 元 素 进行 赋值 。 你 可 以 通过 下 
标 ， 来 说 明 想 对 哪个 元 素 赋予 怎样 的 值 : 


>>>example_list[1i] = 3.0 
>>>example_list # 列表 第 二 个 元 素 变 成 3 .0 


元 组 一 旦 建立 就 不 能 改变 ， 所 以 你 不 能 对 元 组 的 元 素 进行 上 面 的 
赋值 操作 。 


对 于 序列 来 说 ， 除 了 可 以 用 下 标 来 找到 单个 元 素 外 ， 还 可 以 通过 
范围 引用 的 方式 ， 来 找到 多 个 元 素 。 范 围 引用 的 基本 样式 是 : 


序列 名 [下 限 : 上 限 : 步 长 ] 


下 限 表 示 起 始 下 标 ， 上 限 表示 结尾 下 标 。 在 起 始 下 标 和 结尾 下 标 
之 间 ， 按 照 步 长 的 间隔 来 找到 元 素 。 默 认 的 步 长 为 1， 也 就 是 下 限 和 上 
限 之 间 的 每 1 个 元 素 都 会 出 现在 结果 中 。5 引 用 的 多 个 元 素 将 成 为 一 个 新 
的 序列 。 下 面 是 一 些 范围 引用 的 例子 。 


>>>example_tuple[:5] # 从 小 标 9 到 下 标 4， 不 包括 下 标 5 的 元 
素 

>>>example_tuple[2: ] # 从 下 标 2 到 最 后 一 个 元 素 
>>>example_tuple[0:5:2] # 下 标 为 0，2，4 的 元 素 。 


>>>sliced = example_tuple[2:0:-1] # 从 下 标 2 到 下 标 1 
>>>type(sliced) # 范围 引用 的 结果 还 是 一 个 元 组 


上 面 都 是 用 元 组 的 例子 ， 表 的 范围 引用 效果 完全 相同 。 在 范围 引 
用 的 时 候 ， 如 果 写 明 上 限 ， 那 么 这 个 上 限 下 标 措 向 的 元 素 将 不 包括 在 
结果 中 。 


此 外 ，Python 还 提供 了 一 种 尾部 引用 的 语法 ， 用 于 引用 序列 尾部 
的 元 素 : 


>>>example_tuple[-1] # 序列 最 后 一 个 元 素 


>>>example_tuple[-3] # 序列 倒数 第 三 个 元 素 
>>>example_tuple[1:-1] # 序列 的 第 二 个 到 倒数 第 二 个 元 素 


正如 example_tuple[1:-1] 这 个 例子 ， 如 果 是 范围 引用 ， 那 么 上 限 元 
素 将 不 包含 在 结果 中 。 


序列 的 好 处 是 可 以 有 序 地 储存 一 组 数据 。 一 些 数 据 本 身 就 有 有 序 
性 ， 比 如 银行 提供 的 房贷 利率 ， 每 年 都 会 上 下 浮动 。 这 样 的 一 组 数据 
就 可 以 存储 在 序列 中 : 


interest_tuple = (0.01, 0.02, 0.03, 0.035, 0.05) 


4. 词典 


词典 从 很 多 方面 都 和 表 类 似 。 它 同样 是 一 个 可 以 容纳 多 个 元 素 的 
容器 。 但 词典 不 是 以 位 置 来 作为 索引 的 。 词 典 允 许 用 自 定 义 的 方式 来 
建立 效 据 的 索 5| : 


>>>example_ dict = {"tom":11, "sam":57,"lily":100} 


>>>type(example_dict) # RA 'dict' 


词典 包含 有 多 个 元 素 ， 每 个 元 素 以 逗号 分 隔 。 词 典 的 元 素 包含 两 
部 分 ， 键 (Key) 和 值 (Value) 。 键 是 数据 的 索引 ， 值 是 数据 本 身 。 
键 和 值 一 一 对 应 。 比 如 上 面 的 例子 中 ，"tom" 对 应 11 ，"sam" 对 应 
57，"lily" 对 应 100。 由 于 键 值 之 间 的 一 一 对 应 关系 ， 所 以 词典 的 元 素 
可 以 通过 键 来 引用 。 


>>>example_dict["tom"] # 结果 为 11 


在 词典 中 修改 或 增添 一 个 元 素 的 值 : 


>>>example_dict["tom"] = 30 
>>>example_dict["lilei"] = 99 
>>>example_dict #2482 A{"tom": 30, "lily": 100, "lilei": 99, 


"sam": 57} 


构建 一 个 新 的 空 的 词典 : 


>>>example_dict = {} 


>>>example_dict # 结果 为 人 


词典 不 具备 序列 那样 的 连续 有 序 性 ， 所 以 适 于 存储 结构 松散 的 一 
组 数据 。 比 如 首付 比例 和 税率 可 以 存在 同一 个 词典 中 : 


rate = {"premium": 0.2, "tax": 0.15} 


在 词典 的 例子 中 ， 以 及 大 部 分 的 应 用 场景 中 ， 我 们 都 使 用 字符 串 
来 作为 词典 的 键 。 但 其 他 类 型 的 数据 ， 如 数字 和 布尔 值 ， 也 可 以 作为 
词典 的 键 值 。 本 书 将 在 后 面 讲解 ， 究 竟 哪 些 数据 可 以 作为 词典 的 键 
{Bo 


2.3 ”计算 机 懂 选 择 
1. if 结构 


到 现在 为 止 ， 我 们 看 到 的 Python 程序 都 是 指令 式 的 。 在 程序 中 ， 
计算 机 指令 都 按 顺 序 执行 。 指 令 不 能 跳 过 ， 也 不 能 回头 重复 。 最 嘻 的 
程序 都 是 这 个 样子 。 例 如 要 让 灯光 亮 十 次 ， 就 要 重复 写 十 行 让 灯亮 的 


BA 
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为 了 让 程序 能 灵活 ， 早 期 的 编程 语言 加 入 了 “ 跳 转 ”的 功能 。 利 用 
跳 转 指令 ， 我 们 就 能 在 执行 过 程 中 跳 到 程序 中 的 任意 一 行 指令 继续 向 
下 执行 。 例 如 ， 想 重复 执行 ， 融 跳 到 前 面 已 经 执行 过 的 某 一 行 。 程 序 
员 为 了 方便 ， 频 每 地 在 程序 中 向 前 或 向 后 跳 转 。 结 果 ， 程 序 的 运行 顺 
序 看 起 来 就 像 交 缠 在 一 起 的 面条 ， 既 难 读 懂 ， 又 容易 出 错 。 


程序 员 渐 渐 发 现 ， 其 实 跳 转 最 主要 的 功能 ， 就 是 选择 性 地 执行 ， 
或 者 重复 执行 某 段 程序 。 计 算 机 专家 也 论证 出 ， 只 要 有 了 "选择 "和 * 循 


环 ” 两 种 语法 结果 ,“ 跳 转 ” 就 再 无 必要 。 两 种 结构 都 能 改变 程序 执行 的 
流程 ， 改 变 指令 运行 的 次 序 。 编 程 语言 进入 到 结构 化 的 时 代 。 相 对 于 
“ 跳 转 ” 融 来 的 “面条 式 程序 ”，， 结 构 化 的 程序 变 得 赏心悦目 。 在 现代 编 
mist, “ 跳 转 ”语法 已 经 被 彻底 废除 。 


我 们 先 来 看 选择 结构 的 一 个 简单 的 例子 。 如 果 一 个 房子 的 售 价 超 
过 50 万 ， 那 么 交易 费 率 为 1%， 否 则 为 2%。 我 们 用 选择 结构 来 写 一 个 
程序 。 


total = 980000 
if total > 500000: 
transaction_rate = 0.01 
else: 
transaction_rate = 0.02 


print(transaction_rate) # 打印 0.01 


在 这 段 程序 中 ， 出 现 了 我 们 没 见 过 的 if...else... 语 句 。 其 实 这 个 语 
句 的 功能 一 读 就 懂 。 如 果 总 价 超过 50 万 ， 那 么 交易 费 率 为 1%; AN, 
交易 费 率 为 2%。 关 键 字 if 和 else 分 别 有 隶 属于 它们 的 一 行 代码 ， 从 属 代 
码 的 开头 会 有 四 个 空格 的 缩 进 。 程 序 最 终 会 根据 计 后 的 条 件 是 否 
立 ， 选 择 是 执行 ff 的 从 属 代 码 ， 还 是 执行 else 的 从 属 代 码 。 总 之 ，if 结 
构 在 程序 中 实现 了 分 支 。 


if 和 else 后 面 可 以 跟 不 止 一 行 的 程序 : 


total = 980000 


if total > 500000: # 该 条 件 成 立 
print(" 总 价 超过 50 万 ") # 执行 这 一 句 的 打印 
transaction_rate = 0.01 # 设置 费 率 为 0.01 

else: # _ else 部 分 不 执行 


print(" 总 价 不 超过 50 万 ") 
transaction_rate = 0.02 


print(transaction_rate) # 结果 为 0.01 


可 以 看 到 ， 同 属于 计 或 else 的 代码 有 四 个 空格 的 缩 进 。 天 键 词 让 和 
else 就 像 两 个 老大 ， 站 在 行 首 。 老 大 身 旁 还 有 靠 后 站 的 小 第 。 老 大 只 
有 借 着 条 件 赢 了 ， 站 在 其 身后 的 小 弟 才 有 机 会 亮相 。 最 后 一 行 print 语 
句 也 站 在 行 首 ， 说 明 它 和 让 、else 两 位 老大 平起平坐 ,不 存在 隶属 关 
系 。 程 序 不 需要 条 件 判 断 ， 总 会 执行 这 一 句 。 


else 也 并 非 必 需 的 ， 我 们 可 以 写 只 有 if 的 程序 。 比 如 : 


total = 980000 
if total > 500000: 
print(" 总 价 超过 50 万 " ) # 条 件 成 立 ， 执 行 打印 。 


没有 else， 实 际 上 与 空 的 else 等 价 。 如 果 让 后 的 条 件 不 成 立 ， 那 么 
计算 机 什么 都 不 用 执行 。 


2. 小 第 靠 后 站 


用 纺 进 来 表明 代码 的 从 属 关 系 ， 是 Python 的 特色 。 正 如 我 们 在 第 1 
章 中 介绍 的 ， 用 缩 进来 标记 代码 关系 的 设计 源 自 ABC 语言 。 作 为 对 
比 ， 我 们 可 以 看 看 C 语 言 的 写法 : 


if (i>0){ 


这 个 程序 的 意思 是 ， 如 果 变 量 i 大 于 0， 我 们 将 进行 括号 中 所 包括 
的 两 个 赋值 操作 。 在 C 语 言 中 ， 用 一 个 伦 括号 来 表示 从 属于 计 的 代码 
块 。 一 般 程序 员 也 会 在 C 语 言 中 加 入 缩 进 ， 以 便 区 分 出 指令 的 从 属 关 
系 。 但 缩 进 并 非 强 制 的 。 下 面 没 有 缩 进 的 代码 ， 在 C 语 言 中 也 可 以 正 
单 执行 ， 与 上 面 程 序 的 运行 结果 没有 任何 差别 : 


if (i>o0O)f€ 
xX = 1; 
2; 


“v x 


在 Python 中 ， 同 样 的 程序 必须 要 写成 如 下 形式 : 


if i > 0: 


在 Python 中 ， 去 掉 了 i > 0 周围 的 括号 ， 去 除了 每 个 语句 句 尾 的 分 
号 ， 表 示 块 的 伦 括 号 也 消失 了 。 多 出 来 了 f ... 之 后 的 :( 冒 号 )， 还 有 就 
是 x = 1 和 y=2 前 面 有 四 个 空格 的 缩 进 。 通 过 缩 进 ，Python 识 别 出 这 两 
个 语句 是 隶属 于 if 的 。 为 了 区 分 出 隶属 关系 ，Python 中 的 缩 进 是 强制 
的 。 下 面 的 程序 ， 将 产生 完全 不 同 的 效果 : 


这 里 ， 从 属于 if 的 只 有 x=1 这 一 句 ， 第 二 句 赋 值 不 再 归属 于 if。 无 
论 如 何 ，y 都 会 家 赋值 为 2。 


应 该 说 ， 现 在 大 部 分 的 主流 语言 ， 如 C、C++、Java、JavaScript， 
都 是 用 花 括号 来 标记 程序 块 的 ， 缩 进 也 不 是 强制 的 。 这 一 语法 设计 源 
自 于 流行 一 时 的 C 语 言 。 另 一 方面 ， 尽 管 缩 进 不 是 强制 的 ， 但 有 经 验 
的 程序 员 在 用 这 些 语言 写 程序 时 ， 也 会 加 入 缩 进 ， 以 便 程序 更 易 读 。 
很 多 编辑 器 也 有 给 程序 自动 加 缩 进 的 功能 。Python 的 强制 缩 进 看 起 来 
非 主 流 ， 实 际 上 只 是 在 语法 层面 上 执行 了 这 一 惯例 ， 以 便 程序 更 好 


看 ， 也 更 容易 读 。 这 种 以 四 个 空格 的 缩 进 来 表示 隶属 关系 的 书写 方 
式 ， 还 会 在 Python 的 其 他 语法 结构 中 看 到 。 


3. fe Selif 


再 回 到 选择 结构 。 选 择 结构 让 程序 摆脱 了 枯燥 的 指令 式 排列 。 程 
序 的 内 部 可 以 出 现 分 支 一 样 的 结构 。 根 据 条 件 不 同 ， 同 一 个 程序 可 以 
工作 于 多 变 的 环境 。 通 过 elif 语 法 和 蓄 套 使 用 这， 程序 可 以 有 更 加 丰富 
多 彩 的 分 支 方式 。 


下 面 一 个 程序 使 用 了 elif 结 构 。 根 据 条 件 的 不 同 ， 程 序 有 三 个 分 


= 
i=1 
if i > 0: # 条 件 1。 由 于 i 为 1， 这 一 部 分 将 执行 。 
print("positive i") 
i=i+1 
elif i = 0: # 条 件 2。 该 部 分 不 执行 。 
print("i is 0") 
i = i 10 
else: # 条 件 3。 该 部 分 不 执行 。 


print("negative i") 


i=i-1 


这 里 有 三 个 块 ， 分 别 由 if、elif 和 else 引 领 。Python 先 检测 站 的 条 
件 ， 如 果 发 现 计 的 条 件 为 假 ， 则 跳 过 隶属 于 if 的 程序 块 ， 检 测 elif 的 条 
件 ; 如 果 elif 的 条 件 还 是 假 ， 则 执行 else 块 。 程 序 根据 条 件 ， 只 执行 三 
个 分 支 中 的 一 个 。 由 于 i 的 值 是 :， 所 以 最 终 只 有 if 部 分 被 执行 。 按 照 同 
样 的 原理 ， 你 也 可 以 在 if 和 else 之 间 增 加 多 个 elif， 从 而 给 程序 开 出 更 多 
的 分 支 。 


我 们 还 可 以 让 一 个 if 结 构 笛 套 在 另 一 个 if 结 构 中 : 


if i > 1: # 该 条 件 成 立 ， 执 行内 部 的 代码 
print("i bigger than 1") 
print("good") 

ifi 2 # 椒 套 的 if 结 构 ， 条 件 同 样 成 立 。 
print("i bigger than 2") 


print("even better") 


在 进行 完 第 一 个 if 判 断后 ， 如 果 条 件 成 立 ， 那 么 程序 依次 运行 ， 
会 遇 到 第 二 个 if 结构 。 程 序 将 继续 根据 条 件 判 断 并 决定 是 否 执行 。 第 
二 个 后 面 的 程序 块 相 对 于 该 if 又 缩 进 了 四 个 空格 ， 成 为 “小 第 的 小 第 ”。 
进一步 缩 进 的 程序 隶属 于 内 层 的 if。 


总 的 来 说 ， 借 着 if 结构 ， 我 们 给 程序 市 来 了 分 支 。 根 据 条 件 的 不 
同 ， 程 序 将 走 上 不 同 的 道路 ， 如 图 2-2 所 示 。 


图 2-2 “if 选 择 结构 


2.4 “计算 机 能 循环 
1。for 循 环 


循环 用 于 重复 执行 一 些 程序 块 ， 在 Python 中 ， 循 环 有 for 和 while 两 
种 ， 我 们 先 来 看 for 循 环 。 


从 2.3 节 的 选择 结构 ， 我 们 已 经 看 到 了 如 何 用 缩 进来 表示 程序 块 的 
隶属 关系 。 循 环 也 会 用 到 类 似 的 写法 。 隶 属于 循环 结构 的 、 需 要 重复 
的 程序 会 被 缩 进 ， 比 如 : 


for a in [3,4.4,"life"]: 
print(a) # 依次 打印 列表 里 的 各 个 元 素 


这 个 循环 就 是 每 次 从 列表 [3,4.4,"life"] 中 取出 一 个 元 素 ， 然 后 将 这 
个 元 素 赋值 给 c， 之 后 执行 隶属 于 for 的 程序 ， 也 就 是 调用 printO0 池 数 ， 
把 这 个 元 素 打 印 出 来 。 可 以 看 到 ，for 的 一 个 基本 用 法 是 在 in 后 面 跟 一 
个 序列 : 


for m% in ÆJI: 


statement 


序列 中 元 素 的 个 数 决定 了 循环 重复 的 次 数 。 示 例 中 有 3 个 元 素 ， 所 
以 print() 会 执行 3 次 。 也 就 是 说 ，for 循 环 的 重复 次 数 是 确定 的 。for 循 环 
会 依次 从 序列 中 取出 元 素 ， 赋 予 给 紧 跟 在 for 后 面 的 变量 ， 也 就 是 上 面 
示例 中 的 a。 因 此 ， 尽 管 执行 的 语句 都 相同 ， 但 由 于 数据 发 生 了 变化 ， 
所 以 相同 的 语句 在 三 次 执行 后 的 效果 也 会 发 生变 化 。 


从 序列 中 取出 元 素 ， 再 赋予 给 一 个 变量 并 在 隶属 程序 中 使 用 ， 是 
for 循 环 的 一 个 便利 之 处 。 但 有 的 时 候 ， 我 们 只 是 想 简 单 地 重复 特定 的 
次 数 ， 不 想 建立 序列 ， 那 么 我 们 可 以 使 用 Python 提供 的 range0O 国 数 : 


for i in range(5): 


print("Hello World!") # 打印 五 次 "Hello world!" 


程序 中 的 5 向 range0 图 数 说 明了 需要 重复 的 次 数 。 因 此 ， 隶 属于 
for 的 程序 执行 了 5 次 。 这 里 ，for 循 环 后 面 依然 有 一 个 变量 i， 它 为 每 次 
循环 起 到 了 计数 的 功能 : 


for i in range(5): 


print(i, "Hello World! ") # 打印 序号 和 "Hello world!" 


可 以 看 到 ，Python 中 range0) 提 供 的 计数 也 是 从 0 开始 的 ， 和 表 的 下 
标 一 样 。 我 们 还 看 到 print() 的 新 用 法 ， 就 是 在 括号 中 说 明 多 个 变量 ， 
用 逗号 分 开 。 鸳 数 print() 会 把 它们 都 打印 出 来 。 


我 们 看 一 个 for 循 环 的 实用 例子 。 我 们 之 前 用 元 组 记录 了 房贷 的 逐 
年 利率 : 


interest_tuple = (0.01, 0.02, 0.03, 0.035, 0.05) 


假如 有 50 万 元 的 房贷 ， 且 本 金 不 变 ， 那 么 每 年 要 还 的 利息 有 多 人 少 
呢 ? 用 for 循 环 计算 : 


total = 500000 


for interest in interest_tuple: 


repay = total * interest 


print ("每 年 的 利息 : ", repay) 


2 。while 循 环 


Python 中 还 有 一 种 循环 结构 ， 即 while 循 环 。while 的 用 法 是 : 


i=0 
while i < 10: 
print(i) 
i=i+1 # 从 9 打印 到 9 


while 后 面 紧 跟着 一 个 条 件 。 如 果 条 件 为 真 ， 则 while 会 不 集 地 循环 
执行 隶属 于 它 的 语句 。 只 有 条 件 为 假 时 ， 程 序 才 会 停止 。 在 while 的 隶 
属 程序 中 ， 我 们 不 断 改变 参与 条 件 判断 的 变量 i:， 直 到 它 变 成 10， 以 至 
于 还 不 满足 条 件 而 终止 循环 。 这 是 while 循 环 常见 的 做 法 。 否 则 ， 如 果 
while 的 条 件 始终 为 真 ， 则 会 变 成 无 限 循环 。 


一 旦 有 了 无 限 循环 ， 程 序 就 会 不 停 地 运行 下 去 ， 直 到 程序 被 打 断 
或 电脑 关机 。 但 有 时 ， 无 限 循环 也 是 有 用 处 的 。 很 多 图 形 程序 中 就 有 
无 限 循 环 ， 用 于 检查 页 面 的 状态 等 。 如 果 我 们 开发 一 个 无 限 抢 票 的 程 
序 ， 这 样 的 无 限 循环 听 起 来 也 不 错 。 无 限 循环 可 以 用 简单 暴力 的 方法 
写 出 来 : 


while True: 


print("Hello World!") 


总 之 ， 循 环 实现 了 相同 代码 的 重复 执行 ， 如 图 2-3 所 示 。 


图 2-3 ”循环 


3。 跳 过 或 终止 


循环 结构 还 提供 了 两 个 有 用 的 语句 ， 可 以 在 循环 结构 内 部 使 用 ， 
用 于 跳 过 或 终止 循环 。 


continue # 跳 过 循环 的 这 一 次 执行 ， 进 行 下 一 次 的 循环 操作 
break # 停止 执行 整个 循环 


下 面 的 例子 中 使 用 了 continue: 


for i in range(10): 
if i == 2: 
continue 


print(i) # #JEMe, 1. 3. 4. 5. 6. 7. 8. 9, 注意 跳 过 了 2。 


当 循 环 执行 到 i 为 2 的 时 候 ，if 条 件 成 立 ， 触 发 continue， 不 打印 此 
时 的 ;， 程 序 直接 进行 下 一 次 循环 ， 把 3 赋值 给 ;， 继 续 执 行 for 的 隶属 语 
Ho 


continue 只 是 跳 过 某 次 循环 ， 而 break 要 暴力 得 多 ， 它 会 中 止 整个 
循环 。 


for i in range(10): 
if i == 2: 
break 


print(i) # 只 打印 0 和 1 


当 循 环 执行 到 i = 2 的 时 候 ，if 条 件 成 立 ， 触 发 break ， 整 个 循环 停 
止 。 程 序 不 再 执行 for 循 环 内 部 的 语句 。 


附录 A ”小 练习 


在 本 章 中 ， 我 们 学 会 了 运算 和 变量 ， 还 了 解 了 选择 、 循 环 两 种 流 
程控 制 结 构 。 现 在 ， 让 我 们 做 一 个 复杂 些 的 练习 ， 把 学 到 的 东西 一 起 
重 瘟 一 下 。 


假设 我 可 以 全 额 贷款 买房 。 房 子 的 总 价 为 50 万 。 为 了 吸引 购房 
者 ， 房 贷 前 四 年 利率 有 折扣 ， 分 别 1%、2%、3%、3.5%。 其 余 的 年 份 
里 ， 房 贷 的 年 利率 都 是 5%。 我 逐年 还 款 ， 每 次 最 多 偿还 3 万 元 。 那 
么 ， 完 全 还 清 房 款 最 少 需要 多 少年 ? 


想 一 想 如 何 用 Python 来 解决 这 个 问题 。 如 果 想 清楚 了 ， 就 可 以 写 
程序 尝试 一 下 。 学 习 编程 的 最 好 方式 就 是 亲自 动手 ， 努 力 解决 问题 。 
下 面 是 笔者 的 解决 方案 ， 仅 供 参 考 。 


i = 0 
residual = 500000.0 
interest_tuple= (0.01, 0.02, 0.03, 0.035) 


repay = 30000.0 


while residual > 0: 


i=i+1 
print( Wwe ae i, "年 还 是 要 还 钱 ") 
if i<= 4: 


interest = interest_tuple[i - 1] # 序列 的 下 标 从 0 开始 
else: 


interest = 0.05 


residual = residual * (interest + 1) - repay 


print(" 第 ", i+1, "年 终于 还 完了 ") # 偷偷 告诉 你 ， 第 31 年 还 完 
好 了 ， 恭 喜 你 还 完 房贷 ， 也 恭喜 你 学 完 本 章 内 容 。 


附录 B ”代码 规范 


由 于 强制 缩 进 的 规定 ，Python 代 码 看 起 来 相对 比较 整齐 。 但 在 一 
些 细节 上 ， 如 果 你 能 按照 特定 的 规 沁 来 写 代 码 ， 则 会 让 代码 看 起 来 更 
优美 。 笔 者 将 根据 各 章 的 内 容 ， 逐 步 引 入 相应 的 代码 规范 。 


Python 的 官方 文档 中 提供 了 一 套 代 码 规 范 ， 即 PEP82。PEP 是 
Python 改善 建议 (Python Enhancement Proposal) 的 简称 ， 包 含 了 
Python 发 展 历程 中 的 关键 文档 。 除 了 PEP8 中 的 规定 ， 笔 者 还 会 在 下 面 
包括 目 己 写 代 码 的 一 些小 习惯 。 


1. 在 下 列 运算 符 的 前 后 各 保留 一 个 空格 : 


=+- > == >= <<= and or not 


2. 下 列 运算 符 的 前 后 不 用 保留 空格 : 


3. 如 果 有 多 行 赋值 ， 那 么 将 上 下 的 赋值 号 = 对 齐 ， 比 如 : 


I 
m 


num 


secNum = 2 


4. 变量 的 所 有 字母 小 写 ， 单 词 之 间 用 下 男 线 连接 : 


example_number = 10 


(1) 如果 是 Python 2.7， 则 结果 为 <type 'int'>。 


(2) PEP8 文 档 : http://www.python.org/dev/peps/pep-0008 
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在 这 一 章 中 ， 我 们 将 完成 面向 过 程 的 编程 范式 的 学 习 。 通 过 第 2 章 
中 的 选择 和 循环 ， 我 们 已 经 开始 用 结构 化 的 方法 来 封装 程序 了 。 在 这 
一 章 中 ， 我 们 将 看 到 其 他 面向 过 程 的 封装 方法 ， 即 六 数 和 模块 。 函 数 
和 模块 把 成 块 的 指令 封装 成 可 以 重复 调用 的 代码 块 ， 并 借 着 阔 数 名 和 
模块 名 整理 出 一 套 接口 ， 方 便 未 来 调用 。 


3.1 TARSAL 
1. 函数 是 什么 


KZ (Function) 这 个 名 字 会 让 人 想起 中 学 数学 ， 所 以 会 带 来 轻 
微 的 痛苦 。 在 数学 上 ， 子 数 代 表 了 集合 之 间 的 对 应 关系 。 璧 如 说 ， 所 
有 的 汽车 是 一 个 集合 ， 所 有 的 方向 盘 也 是 一 个 集合 。 汽 车 集合 和 方向 
盘 集 合 之 间 存 在 着 对 应 关系 ， 可 以 表达 为 一 个 函数 。 


我 们 再 举 一 个 数学 上 的 例子 。 下 面 的 平方 溯 数 ， 将 一 个 自然 数 对 
应 为 这 个 自然 数 的 平方 : 


f (x) =x, x —-TR AAR 


MAGI, WM (x) 定义 了 两 组 数字 之 间 的 对 应 关系 : 


x -> y 


数学 上 的 函数 定义 了 静态 的 对 应 关系 。 从 数据 的 角度 来 说 ， 函 数 
像 是 “大 变 活 人 ”的 魔法 盒子 ， 这 个 魔法 盒子 能 把 走 进去 的 小 猪 变 成 小 
兔子 《如 图 3-1 所 示 ) 。 对 于 刚才 定义 的 函数 广 (x) ， 进 去 的 是 一 个 自 
然 数 ， 出 来 的 是 这 个 自然 数 的 平方 。 借 着 函数 ， 我 们 实现 了 数据 转 


图 3-1 ”魔法 盒子 


函数 的 魔法 转换 并 非 凭空 生成 。 对 于 编程 中 的 男 数 ， 我 们 可 以 用 
一 系列 指令 来 说 明 函 数 是 如 何 工 作 的 。 编 程 中 的 函数 在 实现 数据 转换 
的 同时 ， 还 能 借 着 指令 ， 实 现 其 他 功能 。 所 以 ， 程 序 员 还 可 以 从 程序 
封装 的 角度 来 理解 函数 。 


对 于 程序 员 来 说 ， 阔 数 是 这 样 一 种 语法 结构 。 它 把 一 些 指令 封装 
在 一 起 ， 形 成 一 个 组 合 拳 。 一 旦 定义 好 了 函数 ， 我 们 就 可 以 通过 对 函 
数 的 调用 ， 来 启动 这 套 组 合 拳 。 因 此 ， 函 数 是 对 封装 理念 的 实践 。 输 
入 数据 被 称 为 参数 ， 参 数 能 影响 函数 的 行为 。 这 就 好 比 同样 的 组 合 拳 
可 以 有 不 同 的 力量 级 别 。 


这 样 ， 我 们 就 有 了 三 种 看 竺 函数 的 方式 : 集合 的 对 应 关系 、 数 据 
的 魔法 盒子 、 语 句 的 封装 。 编 程 教材 一 般 会 选择 其 一 来 说 明子 数 是 什 
么 。 这 三 三 种 解释 方式 都 正确 ， 区 区 别 只 是 看 待 问题 的 角度 。 相 互 参 照 三 
种 互通 的 解释 方式 ， 可 以 更 充分 地 理解 函数 是 什么 。 


2. FEC PRIX 


我 们 首先 制作 一 个 函数 。 制 作 函 数 的 过 程 又 称 为 定义 函数 (define 
function)。 我 们 称 这 个 函数 为 square_sum0。 人 如 其 名 ， 这 个 函数 的 功 
能 是 计算 两 个 数 的 平方 和 : 


def square_sum(a,b): 


az=a2 
b=b 2 
c=a+b 


return c 


最 先 出 现 的 是 def 这 个 关键 字 。 这 个 关键 字 通知 Python“ 这 里 要 定 
义 了 图 数 了 ”。 关 键 字 def 后 面 跟 着 square_sum， 即 函数 的 名 字 。 在 子 数 名 
后 面 ， 还 有 一 个 括号 ， 用 来 说 明子 数 有 哪些 参数 ， 即 括号 中 的 a 和 b。 
参数 可 以 有 多 个 ， 也 可 以 完全 没有 。 根 据 Python 的 语法 规定 ， 即 使 没 
有 输入 数据 ， 销 数 后 面 的 括号 也 要 保留 。 


在 定义 函数 时 ， 我 们 用 了 a 和 b 两 个 符号 来 指 代 输 入 数据 。 等 到 真 
正 使 用 函数 时 ， 我 们 才 会 说 明 a 和 b 有 具体 是 什么 样 的 数字 。 所 以 ， 定 义 
国 数 就 像 是 练武 术 架 式 ， 真 正 调用 函数 时 才 借 着 真实 的 输入 数据 决定 
出 手 力度 。 人 参数 在 函数 定义 的 内 部 起 到 了 和 变量 类 似 的 功能 ， 可 以 用 
符号 化 的 形式 参与 到 任何 一 行 指 令 中 。 由 于 阔 数 定义 中 的 参数 是 一 个 
形式 代表 ， 并 非 真正 数据 ， 所 以 又 称 为 形 参 (Parameter) 。 


在 定义 函数 square_sum0 时 ， 我 们 用 参数 a 和 b 完 成 了 符号 化 的 平方 
求 和 。 而 在 函数 的 具体 执行 中 ， 参 数 所 代表 的 数据 确实 是 作为 一 个 变 
量 存在 的 ， 我 们 将 在 后 面 详 述 这 一 点 。 


括号 结束 时 ， 就 来 到 了 第 一 行 的 末尾 。 末 尾 有 一 个 冒号 ， 后 面 的 
四 行 都 有 缩 进 。 联 系 在 第 2 章 中 的 学 习 ， 我 们 可 以 推测 出 这 里 的 冒号 和 
缩 进 表示 了 代码 的 隶属 关系 。 因 此 ， 后 面 的 四 行 有 缩 进 的 代码 都 是 函 
Msquare_sum(A/)\5. AAEN RIAI o SRAM, 
Python 将 执行 从 属于 阔 数 的 语句 ， 直 到 从 属 语句 结束 。 对 于 
square_sum() 来 说 ， 它 的 前 三 行 都 是 我 们 已 经 熟悉 了 的 运算 语句 。 最 后 
一 句 是 returmn。 关 键 字 retum 用 于 说 明 函 数 的 返回 值 ， 即 函数 的 输出 数 
据 。 


作为 遂 数 的 最 后 一 句 ， 水 数 执行 到 retum 时 就 会 结束 ， 不 管 它 后 面 
是 否 还 有 其 他 函数 定义 语句 。 如 果 把 square_sum(0 改 为 下 面 的 形式 : 


def square_sum(a,b): 


a = a 2 
b = b 2 
c=a+b 
return c 


print("am I alive?") 


则 函数 执行 时 ， 只 会 执行 到 return co 后 面 一 句 printO 虽 然 也 归属 
于 国 数 ， 却 不 会 被 执行 。 所 以 ，return 还 起 到 了 中 止 函 数 和 制定 返回 值 
的 功能 。 在 Python 的 语法 中 ，return 并 不 是 必需 的 。 如 果 没 有 return, 或 
者 retum 后 面 没有 返回 值 时 ， 则 函数 将 返回 None。None 是 Python 中 的 
空 数据 ， 用 来 表示 什么 都 没有 。 关 键 字 return 也 返回 多 个 值 。 多 个 值 跟 
在 return 后 面 ， 以 逗号 分 隔 。 从 效果 上 看 ， 其 等 价 于 返回 一 个 有 多 个 数 
据 的 元 组 。 


return a,b,c # 相当 于 return (a,b,c) 


3. AAR 


EMS BEE MEX. EM AMRIT IS T — EP, 18 
这 件 兵 器 必须 使 用 起 来 ， 才 能 真正 发 挥 作用 。 使 用 函数 的 过 程 叫 作 调 


用 函数 (Call Function) 。 在 第 1 章 中 ， 我 们 已 经 见 过 如 何 调用 printO) 函 


数 : 


print("Hello World!") 


我 们 直接 使 用 了 函数 名 ， 在 括号 里 加 入 具体 的 参数 。 此 时 的 参数 
不 再 是 定义 国 数 时 的 符号 ， 而 是 一 个 实际 的 数据 一 字符 串 "Hello 
World!"。 所 以 ， 在 函数 调用 时 出 现 的 参数 称 为 实 参 (argument) o 


国 数 print0 返 回 值 为 None， 所 以 我 们 并 不 关心 这 个 返回 值 。 但 如 
果 一 个 函数 有 其 他 返回 值 ， 那 么 我 们 可 以 获得 这 个 返回 值 。 一 个 常见 
的 做 法 是 把 返回 值 赋予 给 变量 ， 方 便 以 后 使 用 。 下 面 程 序 中 调用 了 
square_sum()ERIZX: 


x =Square_sum(3, 4) 


print(x) # 结果 为 25 


Python 通过 参数 出 现 的 先后 位 置 ， 知 道 3 对 应 的 是 函数 定义 中 的 第 
一 个 形 参 a， 4 对 应 第 二 个 形 参 b， 然 后 把 参数 传递 给 函数 
square_sum()。 国 数 square_sum0 执 行内 部 的 语句 ， 直 到 得 出 返回 值 
25。 返 回 值 25 赋 予 给 了 变量 x， 最 后 由 printO 打 印 出 来 。 


函数 调用 的 写法 ， 其 实 与 族 数 定义 第 一 行 def 后 面 的 内 容 相 仿 。 只 
不 过 在 调用 函数 时 ， 我 们 把 真实 的 数据 填 入 到 括号 中 ， 作 为 参数 传递 


给 阔 数 。 除 具体 的 数据 表达 式 外 ， 参 数 还 可 以 是 程序 中 已 经 存在 的 变 
量 ， 比 如 : 


a=5 
b=6 
x = square_sum(a, b) 


print(x) # 结果 为 61 


4。 国 数 文档 


水 数 可 以 封 狼 人 代码， 实现 代码 的 复 用 。 对 于 一 些 频繁 调用 的 程 
序 ， 如 果 能 写成 辫 数 ， 再 每 次 调用 其 功能 ， 那 么 将 减少 重复 编程 的 工 
作 量 。 然 而 ， 阔 数 多 了 也 会 有 立 数 多 的 烦恼 。 一 个 问题 常见 就 是 ， 我 
们 经 常会 挟 记 一 个 阔 数 是 用 来 做 什么 的 。 当 然 ， 我 们 可 以 找到 定义 函 
数 的 那些 代码 ， 一 行 一 行 地 读 下 去 ， 尝 试 了 解 自 己 或 别人 在 编写 这 段 
程序 时 的 意图 。 但 这 个 过 程 听 起 来 就 让 人 痛苦 。 要 想 让 未 来 的 自己 或 
他 人 避免 类 似 的 痛苦 ， 就 需要 在 写 阅 数 时 加 上 清晰 的 说 明文 档 ， 说 明 
为数 的 功能 和 用 法 分 别 是 什么 。 


我 们 可 以 用 内 置 阔 数 helpO0 来 找到 某 个 函数 的 说 明文 档 。 以 阔 数 
max0 为 例 ， 用 这 个 函数 用 来 返回 最 大 值 。 比 如 : 


x = max(1, 4, 15, 8) 


print(x) # 结果 为 15 


了 为 数 maxO0 接 收 多 个 参数 ， 再 返回 参数 中 最 大 的 那 一 个 。 如 果 一 时 
想 不 起 来 函数 max0 的 功能 和 所 带 的 参数 ， 那 么 我 们 可 以 通过 help0 来 
求助 。 


>>> help(max) # 以 下 为 help( ) 运 行 的 结果 ， 也 就 是 max( ) 的 说 明文 档 。 
Help on built-in function max in module __builtin _ 


max(...) 
max(iterable[, key=func]) -> value 


max(a, b, c, ...[, key=func]) -> value 


With a single iterable argument, return its largest item. 
With two or more arguments, return the largest argument. 


(END) 


可 以 看 到 ， 阔 数 maxO0 有 两 种 调用 方式 。 我 们 之 前 的 调用 是 按照 第 
二 种 方式 。 此 外 ， 说 明文 档 还 说 明了 函数 max0 的 基本 功能 。 


了 国 数 max0O 属 于 Python 自身 定义 好 的 内 置 函 数 ， 所 以 已 经 提前 准备 
好 了 说 明文 档 。 对 于 我 们 自 定 义 的 图 数 ， 还 需要 自己 动手 。 这 个 过 程 
并 不 复杂 ， 下 面 给 函数 square_sum0 加 上 简单 的 注释 : 


def square_sum(a,b): 


"""return the square sum of two arguments""" 


a = a 2 
b = b**2 
c=a+b 
return c 


在 函数 内 容 一 开始 的 时 候 ， 增 加 了 一 个 多 行 注释 。 这 个 多 行 注 释 
同样 有 缩 进 。 它 将 成 为 该 水 数 的 说 明文 档 。 如 果 我 用 函数 help() 来 查看 
square_sum() 的 说 明文 档 ， 则 help0) 将 返回 我 们 定义 水 数 时 写 下 的 内 


IPA 


容 : 


>>>help(square_sum) 
Help on function square_sum in module __main__: 


square_sum(a, b) 


return the square sum of two arguments 


通 章 来 说 ， 说 明文 档 要 写 得 尽 可 能 详细 一 些 ， 特 别 是 人 们 关心 的 
参数 和 返回 值 。 


3.2 ”参数 传递 


1。 基 本 传 参 


把 数据 用 参数 的 形式 输入 到 函数 ， 补 称 为 参数 传递 。 如 果 只 有 一 
个 参数 ， 那 么 参数 传递 会 变 得 很 简单 ， 只 需 把 函数 调用 时 输入 的 唯一 
一 个 数据 对 应 为 这 个 参数 就 可 以 了 。 如 果 有 多 个 人 参数， 那么 在 调用 子 
数 时 ，Python 会 根据 位 置 来 确认 数据 对 应 哪个 参数 ， 例 如 : 


def print_arguments(a, b, c): 
"""print arguments according to their sequence""" 


print(a, b, c) 


print_arguments(1, 3, 5) # 打印 1、3、 
print_arguments(5, 3, 1) # #JE&5, 3.1 
5 


print_arguments(3, 5, 1) # 打印 3、5、 


在 程序 的 三 次 调用 中 ，Python 都 是 通过 位 置 来 确定 实 参 与 形 参 的 
对 应 关系 的 。 


如 果 觉 得 位 置 传 参 比较 死板 ， 那 么 可 以 用 关键 字 (Keyword) 的 
方式 来 传递 参数 。 在 定义 函数 时 ， 我 们 给 了 形 参 一 个 符号 标记 ， 即 参 
数 名 。 关 键 字 传递 是 根据 参数 名 来 让 数据 与 符号 对 应 上 。 因 此 ， 如 果 
在 调用 时 使 用 关键 子 传递 ， 那 么 不 用 遵守 位 置 的 对 应 关系 。 沿 用 上 面 
的 函数 定义 ， 改 用 参数 传递 的 方式 : 


print_arguments(c=5,b=3,a=1) # 打印 1、3、5 


从 结果 可 以 看 出 ，Python 不 再 使 用 位 置 来 对 应 参数 ， 而 是 利用 了 
参数 的 名 字 来 对 应 参数 和 数据 。 


位 置 传递 与 关键 字 传 递 可 以 混合 使 用 ， 即 一 部 分 的 参数 传递 根据 
位 置 ， 另 一 部 分 根据 参数 名 。 在 调用 函数 时 ， 所 有 的 位 置 参数 都 要 出 
现在 关键 字 参 数 之 前 。 因 此 ， 你 可 以 用 如 下 方式 来 调用 : 


print_arguments(1, c=5,b=3) # 打印 1、3、5 


但 如 果 把 位 置 参 数 1 放 在 关键 子 参 数 c=5 的 后 面 ， 则 Python 将 报 


fit. 


Te. 


print_arguemnts(c=5, 1, b=3) # 程序 报错 


位 置 传递 和 关键 字 传递 让 数据 与 形 参 对 应 起 来 ， 因 此 数据 的 个 数 
与 形 参 的 个 数 应 该 相同 。 但 在 函数 定义 时 ， 我 们 可 以 设置 某 些 形 参 的 
默认 值 。 如 果 我 们 在 调用 时 不 提供 这 些 形 参 的 具体 数据 ， 那 么 它们 将 
采用 定义 时 的 默认 值 ， 比 如 : 


def f(a,b,c=10): 


return atb+c 


print(f(3,2,1)) # 参数 c 取 传 入 的 1。 结 果 打印 6 
print(f(3,2)) # 参数 c 取 默认 值 10。 结 果 打 印 15 


第 一 次 调用 函数 时 输入 了 3 个 数据 ， 正 好 对 应 三 个 形 参 ， 因 此 形 参 
c 对 应 的 数据 是 1。 第 二 次 调用 函数 时 ， 我 们 只 提供 了 3 和 2 两 个 数据。 
国 数 根据 位 置 ， 把 3 和 2 对 应 成 形 参 a 和 b。 到 了 形 参 c 时 ， 已 经 没有 多 余 
的 数据 ， 所 以 c 将 采用 其 默认 值 10。 


2. BARRE 


以 上 传递 参数 的 方式 ， 都 要 求 在 定义 函数 时 说 明 参 数 的 个 数 。 但 
有 时 在 定义 函数 时 ， 我 们 并 不 知道 参数 的 个 数 。 其 原因 有 很 多 ， 有 时 
是 确实 不 知道 参数 的 个 数 ， 需 要 在 程序 运行 时 才能 知道 。 有 时 是 希望 
函数 定义 的 更 加 松散 ， 以 便于 函数 能 运用 于 不 同形 式 的 调用 。 这 时 
(z, BER (packing) 传 参 的 方式 来 进行 参数 传递 会 非常 有 用 。 


和 之 前 一 样 ， 包 于 传 参 也 有 位 置 和 关键 字 两 种 形式 。 下 面 是 包 于 
位 置 传 参 的 例子 : 


def package_position( all_arguments): 


print(type(all_arguments) ) 


print(all_arguments) 


package_position(1,4,6) 


package_position(5,6,7,1,2,3) 


两 次 调用 ， 尽 管 参 数 个 数 不 同 ， 但 都 基于 同一 个 
package_position() 定 义 。 在 调用 package_position() 时 ， 所 有 的 数据 都 根 
据 先后 顺序 ， 收 集 到 一 个 元 组 。 在 函数 内 部 ， 我 们 可 以 通过 元 组 来 读 
取 传 入 的 数据 。 这 就 是 包 右 位 置 传 参 。 为 了 提醒 Python 参数 
all arguments 是 包 嘻 位 置 传递 所 用 的 元 组 名 ， 我 们 在 定义 
package_position0 时 要 在 元 组 名 all_arguments 前 加 号 。 


我 们 再 来 看 看 包 于 关键 字 传 递 的 例子 。 这 一 参数 传递 方法 把 传 入 
的 数据 收集 为 一 个 词典 : 


def package _ keyword( ”all arguments): 
print(type(all arguments)) 


print(all_arguments) 


package_keyword(a=1, b=9) 


package_keyword(m=2, n=1, c=11) 


与 上 面 一 个 例子 类 似 ， 当 函数 调用 时 ， 所 有 参数 会 收集 到 一 个 数 
据 容 器 里 。 只 不 过 ， 在 包 应 关键 子 传递 的 时 候 ， 数 据 容 器 不 再 是 一 个 
元 组 ， 而 是 一 个 了 字典。 每 个 关键 字形 式 的 参数 调用 ， 都 会 成 为 字典 的 


一 个 元 素 。 参 数 名 成 为 元 素 的 键 ， 而 数据 成 为 元 素 的 值 。 字 典 
all_arguments 收 集 了 所 有 的 参数 ， 把 数据 传递 给 函数 使 用 。 为 了 提 
醒 ， 参 数 all arguments 是 包 库 关键 字 传递 所 用 的 字典 ， 因 此 在 


all_arguments 前 加 ”。 


包 右 位 置 传 参 和 包 事 关键 字 传 参 还 可 以 混合 使 用 ， 比 如 : 


def package mix(“positions, **keywords): 
print(positions) 


print(keywords) 


package_mix(1, 2, 3, a=7, b=8, c=9) 


还 可 以 更 进一步 ， 把 包 应 传 参 和 基本 传 参 混合 使 用 。 它 们 出 现 的 
先后 顺序 是 : UB-KREF-BRIUB-BRARF. ATER 
递 ， 我 们 在 定义 函数 时 可 以 更 灵活 地 表示 数据 。 


3. RER 


除了 用 于 函数 定义 ， 和 “还 可 用 于 函数 调用 。 这 时 候 ， 两 者 是 为 
了 实现 一 种 叫 作 解 包 应 (unpacking) 的 语法 。 解 包 右 允许 我 们 把 一 个 
数据 容器 传递 给 沙 数 ， 再 自动 地 分 解 为 各 个 参数 。 需 要 注意 的 是 ， 包 
应 传 参 和 解 包 应 并 不 是 相反 操作 ， 而 是 两 个 相对 独立 的 功能 。 下 面 是 
解 包裹 的 一 个 例子 : 


def unpackage(a,b,c): 


print(a,b,c) 


args = (1,3,4) 


unpackage( args) # 结果 为 1 3 4 


在 这 个 例子 中 ，unpackage0 使 用 了 基本 的 传 参 方法 。 函 数 有 三 个 
BR, RRUAR (RMA AZAAN, KAS Re RAT. 
可 以 看 到 ， 我 们 调用 阔 数 时 传递 的 是 一 个 元 组 。 按 照 基本 传 参 的 方 
式 ， 一 个 元 组 是 无 法 和 三 个 参数 对 应 上 的 。 但 我 们 通过 在 args 前 加 上 - 
符号 ， 来 提醒 Python ， 我 想 把 元 组 拆 成 三 个 元 素 ， 每 一 个 元 素 对 应 函 
数 的 一 个 位 置 参 数 。 于 是 ， 元 组 的 三 个 元 素 分 别 赋 予 了 三 个 参数 。 


相应 的 ， 词 典 也 可 用 于 解 包 襄 ， 使 用 相同 的 unpackage() 定 义 : 


args = {"a":1,"b":2,"c":3} 


unpackage( args) # 打印 1、2、3 


然后 在 传递 词典 args 时 ， 让 词典 的 每 个 键 值 对 作为 一 个 关键 字 传 
递 给 函数 unpackage0O。 
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以 混合 。 依 然 是 相同 的 基本 原则 : UE- KEF- (BRA - 关键 
FRE. 


3.3 ”递归 
1。 高 斯 求 和 与 数学 归纳 法 


递归 是 函数 调用 其 自身 的 操作 。 在 讲解 递归 之 前 ， 先 来 回顾 数学 
家 高 斯 的 一 个 小 故事 。 据 说 有 一 次 ， 老 师 惩 罚 全 班 同学 ， 必 须 算 出 1 到 
100 的 和 才能 回 家 。 只 有 7 岁 的 高 斯 想 出 了 一 个 聪明 的 解决 办 法 ， 后 来 
这 个 方法 被 称 为 高 斯 求 和 公式 。 下 面 我 们 用 编程 的 方法 来 解决 高 斯 求 
和 : 


Sum = 0 
for i in range(1, 101): # range() 这 样 的 写法 表示 从 1 开始 ， 直 到 
100 


sum = sum + i 


print(sum) # 结果 为 5050 


正如 程序 显示 的 ， 循 环 是 解决 问题 的 一 个 自然 想法 。 但 这 并 不 是 
唯一 的 解决 方案 ， 我 们 还 可 以 用 下 面 的 方式 解 题 : 


def gaussian_sum(n): 
if n == 1: 
return 1 


else: 


return n + gaussian_sum(n-1) 


print (gaussian_sum(100) ) # 结果 为 5050 


上 面 的 解法 使 用 了 递归 (Recursion) ， 即 在 一 个 函数 定义 中 ， 调 
用 了 这 个 函数 自身 。 为 了 保证 计算 机 不 陷入 死 循环 ， 递 归 要 求 程序 有 
一 个 能 够 达到 的 终止 条 件 (Base Case) 。 递 归 的 关键 是 说 明 紧 邻 的 两 
个 步骤 之 间 的 衔接 条 件 。 比 如 ， 我 们 已 经 知道 了 1 到 51 的 累加 和 ， 即 
gaussian_sum(51)， 那 么 1 到 52 的 累加 和 就 可 以 很 容易 地 求 得 : 


gaussian_sum(52) = gaussian_sum(51) + 52. 


使 用 递归 设计 程序 的 时 候 ， 我 们 从 最 终结 果 入 手 ， 即 要 想 求 得 
gaussian_sum(100)， 计 算 机 会 把 这 个 计算 拆 解 为 求 得 gaussian_sum(99) 
的 运算 ， 以 及 gaussian_sum(99) 加 上 100 的 运算 。 以 此 类 推 ， 直 到 拆 解 
为 gaussian_sum() 的 运算 ， 就 触发 终止 条 件 ， 也 就 是 if 结构 中 n=1 时 ， 
返回 一 个 具体 的 数 1。 尽 管 整个 递归 过 程 很 复杂 ， 但 在 编写 程序 时 ， 我 
们 只 需 关 注 初 始 条 件 、 终 止 条 件 及 衔接 ， 而 无 须 关 注 具体 的 每 一 步 。 
计算 机 会 负责 具体 的 执行 。 


递归 源 自 数学 归纳 法 。 数 学 归纳 法 (Mathematical Induction) 是 
一 种 数学 证 明 方 法 ， 常 用 于 证 明 命题 由 在 自然 数 范 围 内 成 立 。 随 着 现 
代数 学 的 发 展 ， 自 然 数 范围 内 的 证 明 实际 上 构成 了 许多 其 他 领域 ， 如 
数学 分 析 和 数论 的 基础 ， 所 以 数学 归纳 法 对 于 整个 数学 体系 都 至 关 重 
要 。 


数学 归纳 法 本 身 非常 简单 。 如 果 我 们 想 要 证 明 某 个 命题 对 于 自然 
数 n 成 立 ， 那 么 : 


第 一 步 ” 证 明 命题 对 于 mn = 1 成 立 。 


第 二 步 ” 假设 命题 对 于 mn 成 立 ，m 为 任意 自然 数 ， 则 证 明 在 此 假设 
命题 对 于 n+1 成 立 。 
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想 一 下 上 面 的 两 个 步骤 。 它 们 实际 上 意味 着 ， 命 题 对 于 n = 1 成 立 
> 命题 对 于 n = 2 成 立 -命题 对 于 n = BAIL... 到 无 穷 。 因 此 ， 命 题 
对 于 任意 自然 数 都 成 立 。 这 就 好 像 多 米 诺 骨 有 牌 ， 我 们 确定 n 的 倒 下 会 导 
致 n + 1 的 倒 下 ， 然 后 只 要 推倒 第 一 块 骨牌 ， 就 能 保证 任意 骨牌 的 倒 
下 。 


2. PRATER 


程序 中 的 递归 需要 用 到 栈 (Stack) 这 一 数据 结构 。 所 谓 数据 结 
构 ， 是 计算 机 存储 数据 的 组 织 方式 。 栈 是 数据 结构 的 一 种 ， 可 以 有 序 
地 存储 数据 。 


栈 最 显著 的 特征 是 “后 进 先 出 ” (LIFO，Last In，First Out) 。 当 
我 们 往 箱子 里 存放 一 二 书 时 ， 先 存放 的 书 在 箱子 底部 ， 后 存放 的 书 放 
在 箱子 顶部 。 我 们 必须 将 后 存放 的 书 取出 来 ， 才 能 看 到 和 拿 出 最 开始 
存放 的 书 。 这 就 是 “后 进 先 出 ”。 栈 与 这 个 装 书 的 箱子 类 似 ， 只 能 “后 进 
先 出 ”。 每 一 本 书 ， 也 就 是 栈 的 每 个 元 素 ， 称 为 一 个 帧 (frame) 。 栈 
只 支持 两 个 操作 : pop 和 push。 栈 用 弹出 (pop) 操作 来 取出 栈 顶 元 
R, PHEA (push) 操作 将 一 个 新 的 元 素 存 入 栈 顶 。 


正如 我 们 前 面 所 说 的 ， 为 了 计算 gaussian_sum(100)， 我 们 需要 先 
暂停 gaussian sum(100)， 开 始 gaussian sum(99) 的 计算 。 为 了 计算 
gaussian_sum(99) ， 需要 先 暂 fF gaussian sum(99) ， 调 用 
gaussian_sum(98)......。 在 触发 终止 条 件 前 ， 会 有 很 多 次 未 完成 的 函数 
调用 。 每 次 族 数 调用 时 ， 我 们 在 栈 中 推 入 一 个 新 的 帧 ， 用 来 保存 这 次 
函数 调用 的 相关 信息 。 栈 不 断 增长 ， 直 到 计算 出 gaussian_sum(]) 后 ， 
我 们 又 会 恢复 计算 gaussian_sum(2)、 gaussian_sum(3), ...... 。 由 于 栈 
“后 进 先 出 ”的 特点 ， 所 以 每 次 只 需 弹出 栈 的 帧 ， 就 正好 是 我 们 所 需要 
的 gaussian_sum(2)、 gaussian_sum(3)...... 到 弹出 藏 在 最 底层 的 的 帧 


gaussian_sum(100)。 


所 以 ， 程 序 运 行 的 过 程 ， 可 以 看 作 是 一 个 先 增 长 栈 后 消炎 栈 的 过 
程 。 每 次 函数 调用 ， 都 伴随 着 一 个 帧 入 栈 。 如 果 函 数 内 部 还 有 函数 调 
用 ， 那 么 又 会 多 一 个 帧 入 栈 。 当 函数 返回 时 ， 相 应 的 帧 会 出 栈 。 等 到 
程序 的 最 后 ， 栈 清空 ， 程 序 就 完成 了 。 


3。 变 量 的 作用 域 


有 了 函数 栈 的 铺垫 ， 变 量 的 作用 域 就 变 得 简单 了 。 函 数 内 部 可 以 
创建 新 变量 ， 如 下 面 的 一 个 函数 : 


def internal_var(a, b): 
c=a+b 


return c 


print(internal_var(2, 3)) # 结果 为 5 


事实 上 ，Python 寻 找 变量 的 范围 不 止 是 当前 帧 。 它 还 会 寻找 
外 部 ， 也 就 是 Python 的 主 程序 多 中 定义 了 的 变量 。 因 此 ， 在 一 1 
内 部 ， 我 们 能 “看 到 ” 遂 数 外 部 已 经 存在 的 变量 。 比 如 下 面 的 程序 : 


数 


x 
SEX 


def inner_var(): 


print(m) 
m= 5 
inner_var() # 结果 将 打印 5 


当主 程序 中 已 经 有 了 一 个 变量 ， 函 数 调用 内 部 可 以 通过 赋值 的 方 
式 再 创建 了 一 个 同名 变量 。 函 数 会 优先 使 用 自己 函数 帧 中 的 那个 变 
量 。 在 下 面 的 程序 中 ， 主 程序 和 水 数 external_var() 都 有 一 个 info 变 量 。 
在 为 数 external_var0 内 部 ， 会 优先 使 用 函数 内 部 的 那个 info: 


def external_var(): 
info = "Vamei's Python" 


print(info) # 结果 为 "Vamei's Python" 


info= "Hello World!" 


external_var() 


print(info) # 结果 为 "Hello world!" 


且 遂 数 内 部 使 用 的 是 自己 内 部 的 那 一 份 ， 所 以 遂 数 内 部 对 info 的 
操作 不 会 影响 到 外 部 变量 info。 


图 数 的 参数 与 函数 内 部 变量 类 似 。 我 们 可 以 把 参数 理解 为 玫 数 内 
部 的 变量 。 在 阔 数 调用 时 ， 会 把 数据 赋值 给 这 些 变 量 。 等 到 函数 返回 
时 ， 这 些 参数 相关 的 变量 会 被 清空 。 但 也 有 特例 ， 如 下 面 的 例子 : 


b = [1,2,3] 
def change_list(b): 
b[0] = b[0] + 1 


return b 


print(change_list(b)) # 打印 [2，2，3] 
print(b) # FJEN[2, 2, 3] 
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变化 。 当 参数 是 一 个 数据 容器 时 ， 函 数 内 外 部 只 存在 一 个 数据 容器 ， 
所 以 阔 数 内 部 对 该 数据 容器 的 操作 ， 会 影响 到 函数 外 部 。 这 涉及 到 
Python 的 一 个 微妙 机 制 ， 我 们 会 在 第 7 和 章 对 此 深入 探索 。 现 在 需要 记 住 
的 是 ， 对 于 数据 容器 来 说 ， 函 数 内 部 的 更 改 会 影响 到 外 部 。 


3.4 引入 那 把 宝剑 


1。5| 入 模块 


网上 曾经 流行 一 个 技术 讨论 :“ 如 何 用 编程 语言 杀 死 一 条 龙 ? ”有 
很 多 有 趣 的 答案 ， 比 如 Java 语 言 ， 是 “ 赶 到 那里 ， 找 到 巨 龙 ， 开 发 出 一 
套 由 多 个 功能 层 组 成 的 恶 龙 歼灭 框架 ， 写 几 篇 关于 这 种 框架 的 文 
章 ...... 但 巨 龙 并 没有 被 消炎 掉 。” 这 个 回答 其 实 是 在 取笑 Java 复 杂 的 框 
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头 ， 找 到 公主 ..……. 把 公主 晾 在 一 边 ， 去 看 看 有 没有 最 新 提交 的 Linux 内 
核 代 码 。” 这 个 答案 则 是 夸奖 C 语 言 的 强大 ， 以 及 C 语 言 社区 对 Linux 内 
核 的 投入 。 至 于 Python 语言 ， 很 简单 : 


importslay_dragon 


了 解 Python 模 块 的 人 会 对 这 行 代码 微微 一 笑 。 在 Python 中 ， 一 
个 .py 文件 就 构成 一 个 模块 。 通 过 模块 ， 你 可 以 调用 其 他 文件 中 的 疗 
数 。 而 引入 (import) 模块 ， 就 是 为 了 在 新 的 程序 中 重复 利用 已 有 的 
Python 程序 。Python 通 过 模块 ， 让 你 可 以 调用 其 他 文件 中 的 函数 。 我 
们 先 写 一 个 first.py 文 件 ， 内 容 如 下 : 


def laugh(): 


print ("HaHaHaHa" ) 


再 在 同一 目录 下 写 一 个 second.py 文 件 。 在 这 段 程序 中 引入 first 模 
块 : 


from first import laugh 
for i in range(10): 


laugh( ) 


借 着 import 语 句 ， 我 们 可 以 在 second.py 中 使 用 firstpy 中 定义 的 
laugh0 国 数 。 除 了 函数 ， 我 们 还 可 以 引入 其 他 文件 中 包含 的 数据 。 比 
如 我 们 在 module_var.py 中 写 入 : 


text = "Hello Vamei" 


在 import_demo.py 中 ， 我 们 引入 这 一 变量 : 


from import_demo import text 


print(text) # 打 Ej'Hello Vamei' 


对 于 面向 过 程 语言 来 说 ， 模 块 是 比 消 数 更 高 一 层 的 封闭 模式 。 程 
序 可 以 以 文件 为 单位 实现 复 用 。 典 型 的 面向 过 程 语言 ， 如 C 语 言 ， 有 
很 完善 的 模块 系统 。 把 常见 的 功能 编 到 模块 中 ， 方 便 未 来 使 用 ， 就 成 
为 所 谓 的 库 (library) 。 由 于 Python 的 库 非 常 丰富 ， 所 以 很 多 工作 都 可 


以 通过 引用 库 ， 即 借助 前 人 的 工作 来 完成 。 这 也 是 Python 要 用 import 语 
句 来 杀 龙 的 原因 。 


2。 搜 索 路 径 


我 们 刚才 在 引入 模块 时 ， 把 库 文 件 和 应 用 文件 放 在 了 同一 文件 夹 
下 。 当 在 该 文件 夹 下 运行 程序 时 ，Python 会 自动 在 当前 文件 夹 搜索 它 
想 要 引入 的 模块 。 


但 Python 还 会 到 其 他 的 地 方 寻找 库 : 
(1) 标准 库 的 安装 路 径 
(2) 操作 系统 环境 变量 PYTHONPATH 所 包含 的 路 径 


标准 库 是 Python 官 方 提供 的 库 。Python 会 自动 搜索 标准 库 所 在 的 
路 径 。 因 此 ，Python 总 能 正确 地 引入 标准 库 中 的 模块 。 例 如 : 


import time 


如 果 你 是 自 定义 的 模块 ， 则 可 以 放 在 自 认 为 合适 的 地 方 ， 然 后 修 
改 PYTHONPATH 这 个 环境 变量 。 当 PYTHONPATH 包 含 模块 所 在 的 路 
径 时 ，Python 便 可 以 找到 那个 模块 。 修 改 PYTHONPATH 的 方式 可 参考 
本 章 附 录 A。 


3.5 “异常 处 理 
1. 恼人 的 bug 


bug 一 定 是 程序 员 最 痛恨 的 生物 了 。 程 序 员 眼中 的 bug， 是 指 程序 
缺陷 。 这 些 程序 缺陷 会 引发 错误 或 者 意 想不到 的 后 果 。 很 多 时 候 ， 程 
序 bug 可 以 事后 修复 。 当 然 ， 也 存在 无 法 修复 的 教训 。 欧 洲 ARIANE 5 
火箭 第 一 次 发 射 时 ， 在 一 分 钟 之 内 爆炸 。 事 后 调查 原因 ， 发 现 导 航程 
序 中 的 一 个 浮 点 数 要 转换 成 整数 ， 但 由 于 数值 过 大 溢出 。 此 外 ， 现 国 
直升机 于 1994 年 坠毁 ，29 人 死亡 。 调 查 显 示 ， 直 升 机 的 软件 系统 “充满 
缺陷 ”。 而 电影 《2001 太 空 漫游 》 中 ， 超 级 计算 机 HAL 杀 死 了 几乎 所 有 
的 宇航 员 ， 原 因 是 HAL 程 序 中 的 两 个 目标 出 现 了 冲突 。 


在 英文 中 ，bug 是 虫子 的 意思 。 工 程 师 很 早 就 开始 用 bug 这 个 词 来 
中 代 机 械 缺 陷 。 而 软件 开发 中 使 用 bug 这 个 词 ， 还 有 一 个 小 故事 。 曾 经 
有 一 只 蛾 子 飞 进 一 台 早期 计算 机 ， 造 成 这 台 计 算 机 出 错 。 从 那 以 后 ， 
bug 就 被 用 于 指 代 程序 缺陷 。 这 只 蛾 子 后 来 被 贴 在 日 志 本 上 ， 至 今 还 在 
美国 国家 历史 博物 馆 展 出 。 


很 多 程序 缺陷 都 可 以 很 早 发 现 并 改正 。 比 如 ， 下 面 程 序 错 用 了 语 
法 ， 在 for 的 一 行 没有 加 引号 。 


for i in range(10) 


print(i) 


Python 不 会 运行 这 段 程 序 。 它 会 提醒 你 有 语法 错误 : 


SyntaxError: invalid syntax 


下 面 的 程序 并 没有 语法 上 的 错误 ， 但 在 Python 运行 时 ， 会 发 现 引 
用 的 下 标 超出 了 列表 元 素 的 汇 围 : 


a Sify Q 3] 


print(a[3]) 


程序 会 中 止 报错 : 


IndexError: list index out of range 


上 面 这 种 只 有 在 运行 时 ， 编 译 器 才 会 发 现 的 错误 被 称 为 运行 时 错 
误 (Runtime Error) 。 由 于 Python 是 动态 语言 ， 许 多 操作 必须 在 运行 
时 才 会 执行 ， 比 如 确定 变量 的 类 型 等 。 因 此 ，Python 要 比 静 态 语 言 更 
容易 产生 运行 时 错误 。 


还 有 一 种 错误 ， 称 为 语义 错误 (Semantic Error) 。 编 译 器 认为 你 
的 程序 没有 问题 ， 可 以 正常 运行 。 但 当 检 查 程序 时 ， 却 发 现 程序 并 非 


你 想 做 的 。 通 常 来 说 ， 这 种 错误 最 为 隐 落 ， 也 最 难 纠正 。 比 如 下 面 这 
个 程序 ， 目 的 是 打印 列表 的 第 一 个 元 素 : 


bundle 二 ["a", "b", "c"] 
print(bundle[1]) 


程序 并 没有 错误 ， 正 常 打印 。 但 你 发 现 ， 打 印 出 的 是 第 二 个 元 
素 "b"， 而 不 是 第 一 个 元 素 。 这 是 因为 Python 列表 的 下 标 是 从 0 开始 
BY, 所 以 引用 第 一 个 元 素 ， 下 标 应 该 是 0 而 不 是 1。 


2. Debug 


修改 程序 缺陷 的 过 程 称 为 debug。 计 算 机 程序 具有 确定 性 ， 所 以 错 
误 的 产生 总 会 有 其 根源 。 当 然 ， 有 时 花 大 量 时 间 都 不 能 debug 一 段 程 
序 ， 确 实 会 产生 强烈 的 挫败 感 ， 甚 至 认为 自己 不 适合 做 程序 开发 。 还 
有 的 人 怒 摔 键盘 ， 认 为 电脑 在 玩 自己 。 就 我 个 人 的 观察 来 说 ， 再 优秀 
的 程序 员 ， 在 写 程序 时 也 总 会 产生 bug。 只 不 过 ， 优 秀 的 程序 员 在 
debug 的 过 程 中 更 心平 气 和 ， 不 会 因为 bug 而 质疑 目 己 。 他 们 甚至 会 把 
debug 的 过 程 当 作 一 种 训练 ， 通 过 更 好 地 理解 错误 根源 来 让 目 己 的 计算 
机 知识 更 上 一 层 楼 。 


其 实 ，debug 有 点 像 做 侦探 。 搜 集 蛛 丝 马 迹 的 证 据 ， 排 除 清白 的 嫌 
颖 人， 最 后 留 下 真 凶 。 收 集 证 据 的 方法 有 很 多 ， 也 有 许多 现成 的 工 
具 。 对 于 初学 者 来 说 ， 不 需要 伦 太 多 的 时 间 在 这 些 工具 上 。 在 程序 内 
部 插入 简单 的 print0 阅 数 ， 就 可 以 查看 变量 的 状态 以 及 运行 进度 。 有 


时 ， 还 可 以 将 某 个 指令 替换 成 其 他 形式 ， 看 看 程序 结果 有 何 变化 ， 从 
而 验证 自己 的 假设 。 当 其 他 可 能 性 都 排除 了 ， 那 么 剩 下 的 就 是 导致 错 
误 的 真正 的 原因 。 


从 另 一 个 方面 来 看 ，debug 也 是 写 程 序 的 一 个 自然 部 分 。 有 一 种 开 
发 程序 的 方式 ， 就 是 测试 驱动 开发 (Test-Driven Development , 
TDD) 。 对 于 Python 这 样 一 种 便捷 的 动态 语言 来 说 ， 很 适合 先 写 一 个 
小 型 的 程序 ， 实 现 特定 的 功能 。 然 后 ， 在 小 程序 的 基础 上 上， 渐进 地 修 
改 ， 让 程序 不 断 进 化 ， 最 后 满足 复杂 的 需求 。 整 个 过 程 中 ， 你 不 断 增 
加 功能 ， 也 不 断 改正 某 些 错误 。 重 要 的 是 ， 你 一 直 在 动手 编程 。 
Python 作者 本 人 就 很 喜欢 这 种 编程 方式 。 因 此 ，debug 其 实 是 你 写 出 完 
美 程序 的 一 个 必要 步骤 。 


3。 异 常 处 理 


对 于 运行 时 可 能 产生 的 错误 ， 我 们 可 以 提前 在 程序 中 处 理 。 这 样 
做 有 两 个 可 能 的 目的 : 一 个 是 让 程序 中 止 前 进行 更 多 的 操作 ， 比 如 提 
供 更 多 的 关于 错误 的 信息 。 另 一 个 则 是 让 程序 在 犯错 后 依然 能 运行 下 
去 。 


异常 处 理 还 可 以 提高 程序 的 容错 性 。 下 面 的 一 段 程序 就 用 到 了 异 
常 处 理 : 


while True: 


inputStr = input("Please input a number:") # 等 待 输入 


try: 
num = float(inputStr ) 
print("Input number:", num) 
print("result:", 10/num) 
exceptValueError: 
print("Illegal input. Try Again.") 
exceptZeroDivisionError: 


print("Illegal devision by zero. Try Again.") 
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来 接收 命令 行 的 输入 。 而 float(0) 函 数 则 用 于 把 其 他 类 型 的 数据 转换 为 浮 
点 数 。 如 果 输 入 的 是 一 个 字符 串 ， 如 "p"， 则 将 无 法 转换 成 浮 点 数 ， 并 
触发 ValueError， 而 相应 的 except 就 会 运行 隶属 于 它 的 程序 。 如 果 输 入 
的 是 0， 那 么 除法 的 分 母 为 0， 将 触发 ZeroDivisionError。 这 两 种 错误 都 
由 预 设 的 程序 处 理 ， 所 以 程序 运行 不 会 中 止 。 


如 果 没 有 发 生 异 常 ， 比 如 输入 5.0， 那 么 try 部 分 正常 运行 ，except 
部 分 被 跳 过 。 异 常 处 理 完整 的 语法 形式 为 : 
try: 
except exceptioni: 


except exception2: 


else: 


finally: 


如 果 try 中 有 异常 发 生 时 ， 将 执行 异常 的 归属 ， 执 行 except。 异 常 

层 比 较 ， 看 是 否 是 exception1、exception2...... 到 找到 其 归属 ， 执 
Ee 如 果 try 中 没有 异常 ， 那 么 except 部 分 将 跳 
过 ， 执 行 else 中 的 语句 。 


finally 是 无 论 是 否 有 异 单 ， 最 后 都 要 做 的 一 些 事情 。 


如 果 except 后 面 没有 任何 参数 ， 那 么 表示 所 有 的 exception 都 交 给 这 
段 程 序 处理 ， 比 如 : 


while True: 
inputStr = input("Please input a number:") 
try: 
num = float(inputStr ) 
print("Input number:", num) 
print("result:", 10/num) 
except: 


print("Something Wrong. Try Again." ) 


如 果 无 法 将 异常 区 给 合适 的 对 象 ， 那 么 异常 将 继续 向 上 层 抛 出 ， 
直到 被 捕捉 或 者 造成 主 程序 报错 ， 比 如 下 面 的 程序 : 


def test_func(): 
try: 
m = 1/0 
exceptValueError: 


print("Catch ValueError in the sub-function") 


try: 
test_func() 
exceptZeroDivisionError: 


print("Catch error in the main program") 


子 程序 的 try...except... 结 构 无 法 处 理 相 应 的 除 以 0 的 错误 ， 所 以 错 
误 被 抛 给 上 层 的 主 程序 。 


使 用 raise 关 键 字 ， 我 们 也 可 以 在 程序 中 主动 抛 出 异常 。 比 如 : 


raiseZeroDivisionError() 


附录 A ”搜索 路 径 的 设置 


Python 引入 模块 时 ， 会 到 搜索 路 径 寻 找 相 应 的 模块 。 如 果 引 入 失 
败 ， 则 有 可 能 是 搜索 路 径 设置 不 正确 。 我 们 可 以 按照 下 面 的 办 法 来 设 
置 搜索 路 径 。 


在 Python 内 部 ， 可 以 用 下 面 的 方法 来 查询 搜索 路 径 : 


>>>import sys 


>>>print(sys.path) 


可 以 看 到 ，sys.path 是 一 个 列表 。 列 表 中 的 每 个 元 素 都 是 一 个 会 被 
搜索 的 路 径 。 我 们 可 以 通过 增加 或 删除 这 个 列表 中 的 元 素 ， 来 控制 
Python 的 搜索 路 径 。 


上 面 的 更 改 方法 是 动态 的 ， 所 以 每 次 写 程序 时 都 要 添加 相关 的 改 
变 。 我 们 也 可 以 设置 PYTHONPATH 环 境 变 量 ， 来 静态 改变 Python 搜索 
路 径 。 在 Linux 系 统 下 ， 可 以 在 home 文 件 夹 下 的 .bashrc 文 件 中 添加 下 面 
一 行 ， 来 改变 PYTHONPATH: 


export PYTHONPATH=/home/vamei/mylib : $PYTHONPATH 


这 一 行 的 含义 是 在 原 有 的 PYTHONPAIH 基础 上 ， 加 
上 /home/vamei/mylib。 在 Mac 下 需要 修改 的 文件 是 home 文 件 夹 下 
的 .bash_profile， 修 改 方法 和 Linux 类 似 。 


在 Windows 下 也 可 以 设置 PYTHONPATH。 右 击 “ 计 算 机 ”， 在 菜单 
中 选择 属性 。 这 时 会 出 现 一 个 “系统 ”窗口 。 单 击 “ 高 级 系统 设置 "， 会 
出 现 一 个 叫 “ 系 统 属性 ”的 窗口 。 选 择 环境 变 量 ， 在 其 中 添加 
PYTHONPATH 的 新 变量 ， 然 后 设置 这 个 变量 的 值 ， 即 想 要 搜索 的 路 
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WRB ”安装 第 三 方 模块 


除 标 准 库 中 的 模 外 ， 还 有 很 多 第 三 方 贡献 的 Python 模 块 。 安 装 这 
些 模块 最 常用 的 方式 是 使 用 pip。 在 安装 Python 时 ，pip 也 会 安装 在 你 的 
计算 机 中 。 如 果 想 安装 第 三 方 模块 ， 如 numpy， 那 么 可 以 使 用 下 面 的 
方式 安装 : 


$pip installnumpy 


如 果 使 用 了 virtualenv， 那 么 每 个 虚拟 环境 都 会 提供 一 个 对 应 改 虚 
拟 环境 Python 版 本 的 pip。 在 某 个 环境 下 使 用 pip， 模 块 会 安装 到 该 虚拟 
环境 中 。 如 果 你 切换 虚拟 ， 那 么 所 使 用 的 模块 和 模块 的 版 本 都 会 随 之 
变化 ， 从 而 避免 了 模块 与 Python 版 本 不 符 的 尴 砍 。 


在 EPD Python 和 Anaconda 下 ， 还 提供 了 额外 的 安装 第 三 方 模块 的 
工具 ， 可 前 往 官 网 查阅 使 用 方法 。 可 以 利用 下 面 命令 ， 来 找到 安装 的 
所 有 模块 ， 以 及 模块 的 版 本 : 


$pip freeze 


附录 C 代码 规范 


对 于 本 章 中 出 现 的 函数 和 模块 ， 我 在 命名 时 全 部 使 用 的 是 小 写字 
母 。 单 词 之 间 用 下 男 线 连 接 。 以 上 用 法 也 与 PEP8 中 对 函数 和 模块 的 规 
定 相 符 。 本 章 在 讲解 “异常 处 理 * 时 ， 异 常 都 是 如 ValueError 这 样 的 类 。 
关于 类 的 代码 规范 将 在 下 一 章 讲解 。 


(1) 命题 是 对 某 个 现象 的 描述 。 


(2) 所 谓 的 主 程序 ， 其 实 就 是 一 个 .py 程序 构成 的 模块 。 我 将 在 下 一 节 讲 解 模 块 。 这 里 暂时 
不 严格 地 称 为 主 程序 。 


第 4 章 “” 朝 思 墓 想 是 对 象 


41 轻松 看 对 象 
4.2 AKA] 
4.3 那些 年 ， 错 过 的 对 象 
44 意 想 不 到 的 对 象 


附录 A = URS HE 


看 过 Python 面向 过 程 的 编程 范式 之 后 ， 我 们 在 这 一 章 将 使 用 一 种 
完全 不 同 的 编程 范式 一 一 面向 对 象 (Objected-Oriented) 。Python 不 只 
是 一 门 文 持 面向 对 象 范 式 的 语言 。 在 多 范式 的 外 表 下 ，Python 用 对 象 
来 构建 它 的 大 框架 。 因 此 ， 我 们 可 以 及 早 切 入 面向 对 象 编程 ， 从 而 了 
解 Python 的 深层 魅力 。 


4.1 轻松 看 对 象 
1. 面向 对 象 语言 的 来 历 


要 想 了 解 面向 对 象 ， 就 要 先 来 了 解 类 (Class) MAR 
(Object) 。 还 记得 面向 过 程 中 的 冰 数 和 模块 吗 ， 它 们 提高 了 程序 的 
可 复 用 性 。 类 和 对 象 同样 提高 了 程序 的 可 复 用 性 。 除 此 之 外 ， 类 和 对 
象 这 两 种 语法 结构 还 加 强 了 程序 模拟 真实 世界 的 能 力 。“ 模 拟 *"， 正 是 
面向 对 象 编程 的 核心 。 


面向 对 象 范式 可 以 追溯 到 Simula 语 言 。 克 利 斯 登 . 奈 加 特 是 这 门 语 
言 的 两 位 作者 之 一 。 他 被 挪威 国防 部 征召 入 伍 ， 然 后 服务 于 挪威 防务 
科学 研究 所 。 作 为 一 名 训练 有 素 的 数学 家 ， 克 利 斯 登 . 妹 加 特 一 直 在 用 
电脑 解决 国防 中 的 计算 问题 ， 例 如 核反应 堆 建 设 、 舰 队 补给 、 后 勤 供 
应 等 。 在 解决 这 些 问题 的 过 程 中 ， 奈 加 特需 要 用 电脑 来 模拟 出 真实 世 
界 的 状况 。 比 如 说 ， 如 果 发 生 一 次 核 泄漏 ， 会 造成 怎样 的 影响 。 奈 加 
特 发 现 ， 按 照 之 前 过 程式 的 、 指 令 式 的 编程 方式 ， 他 很 难 用 程序 来 表 
示 真 实 世 界 中 的 个 体 。 就 拿 一 稻 船 来 说 ， 我 们 知道 它 会 有 一 些 数 据 ， 
如 高 度 、 宽 度 、 马 力 、 吃 水 量 等 。 它 还 会 有 一 些 动作 ， 如 移动 、 加 


GR. DA. FAS. RAE TTA. BEMAALMATR, 
如 战列舰 和 航母 都 是 军舰 。 有 些 个 体 之 间 有 着 包含 关系 ， 如 一 条 船 有 
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当 人 们 讲 故 事 时 ， 会 自然 而 然 地 描述 来 自 真实 世界 的 个 体 。 但 对 
只 懂 0/1 序 列 的 计算 机 来 说 ， 它 只 会 机 械 地 执行 一 条 条 指令 。 奈 加 特 
希望 ， 当 他 想 要 用 计算 机 做 模拟 时 ， 能 像 讲 故事 一 样 简单 。 他 赁 着 自 
己 在 军事 和 民用 方面 的 经 验 ， 知 道 这 样 的 一 种 编程 语言 有 着 巨大 的 潜 
力 。 最 终 ， 他 遇 到 了 计算 机 专家 奥 利 -约翰 :达尔 。 达 尔 帮助 祭 加 特 把 
他 的 想法 变 成 一 门 新 颖 的 语言 一 Simula。 这 门 语 言 的 名 字 ， 正 是 奈 加 
特 朝 思 暮 想 的 “模拟 ”()。 


我 们 可 以 把 面向 对 象 看 作 是 故事 和 指令 之 间 的 桥 染 。 程 序 员 用 一 
种 故事 式 的 编程 语言 描述 问题 ， 随 后 编译 器 会 把 这 些 程 序 翻 译 成 机 器 
目 令 。 但 在 计算 机 发 展 的 早期 ， 这 些 额外 的 翻译 工作 会 消耗 太 多 的 计 
算 机 资源 。 因 此， 面向 对 象 的 编程 范式 并 不 流行 。 一 些 纯粹 的 面向 对 
象 语言 ， 也 经 单 因为 效率 低下 而 受到 诉 病 。 


随 着 计算 机 性 能 的 提高 ， 效 率 问 题 不 再 是 瓶颈 。 人 们 转 而 关注 程 
序 员 的 产量 ， 开 始 发 掘 面向 对 象 语言 的 潜力 。 在 面向 对 象 领域 最 先 取 
得 辉煌 成 功 的 是 C++ 语 言 。 比 雅 尼 : 斯 特 劳 斯 特 鲁 普 在 C 语 言 的 基础 上 
增加 面向 对 象 的 语法 结构 ， 创 造 出 C++ 语 言 。C++ 杂 糠 了 C 语 言 特征 ， 
所 以 显得 异 音 复杂。 后 来 的 Java 语 言 向 着 更 纯粹 的 面向 对 象 范 式 靠 
拢 ， 很 快 获 得 了 商业 上 的 成 功 。C++ 和 Java 一 度 成 为 最 流行 的 编程 语 
言 。 后 来 微软 推出 的 C# 语 言 ， 以 及 苹果 一 直 在 支持 的 Objective-C 语 
言 ， 也 都 是 典型 的 面向 对 象 语言 。 


Python 也 是 一 门面 向 对 象 语 言 。 它 比 Java 还 要 历史 悠久 。 只 不 
过 ，Python 人 允许 程序 员 以 纯粹 的 面向 过 程 的 方式 来 使 用 它 ， 所 以 人 们 
有 时 会 忽视 它 那 颗 面向 对 象 的 心 。 Python 的 一 条 哲学 理念 是 “一 切 皆 对 
象 ”"。 无 论 是 我 们 第 3 章 看 到 的 面向 过 程 范 式 ， 还 是 未 来 会 看 到 的 函数 
式 编程 ， 其 实 都 是 特殊 的 对 象 模拟 出 的 效果 。 因 此 ， 学 习 面 向 对 象 是 
学 Python 的 一 个 关键 环节 。 只 有 了 解 了 Python 的 对 象 ， 我 们 才能 看 到 
这 门 语言 的 全 貌 。 


2. 类 


说 是 要 “ 找 对 象 *， 我 们 第 一 个 看 的 却 是 个 叫 作 “ 类 ”的 语法 结构 。 
这 里 的 类 其 实 和 我 们 日 常生 活 中 的 “类 ”的 概念 差不多 。 日 常生 活 中 ， 
我 们 把 相近 的 东西 归 为 一 类 ， 而 且 给 这 个 类 起 一 个 名 字 。 比 如 说 ， 乌 
类 的 共同 属性 是 有 羽毛 ， 通 过 产儿 生育 后 代 。 任 何 一 只 特别 的 乌 都 是 
建立 在 乌 类 的 原型 基础 上 的 。 


下 面 我 们 用 Python 语言 来 记录 上 面 的 想法 ， 描 述 乌 类 : 


class Bird(object): 
feather = True 


reproduction = "egg" 


在 这 里 ， 我 们 用 关键 字 class 来 定义 一 个 类 。 类 的 名 字 就 是 乌 
(Bird) 。 括 号 里 有 一 个 关键 词 object， 也 就 是 “东西 * 的 意思 ， 即 某 一 
个 个 体 。 在 计算 机 语言 中 ， 我 们 把 个 体 称 为 对 象 。 一 个 类 别 下 ， 可 以 


有 多 个 个 体 。 鸟 类 就 可 以 包括 邻居 老 王 养 的 金 丝 件 、 天 边 正 飞 过 的 那 
只 马 鸦 ， 以 及 家 里 养 的 一 只 小 黄 鸡 。 


冒号 和 缩 进 说 明了 属于 这 个 类 的 代码 。 在 隶属 于 这 个 类 别 的 程序 
块 中 ， 我 们 定义 了 两 个 量 ， 一 个 用 于 说 明 乌 类 有 汐 毛 (feather) ， 另 
一 个 用 于 说 明 乌 类 的 繁殖 方式 (reproduction) ， 这 两 个 量 称 为 类 的 属 
性 (attribute) 。 我 们 定义 乌 类 的 方法 很 粗糙 ， 乌 类 只 不 过 是 “有 毛 能 
产 蛋 ”的 东西 。 要 是 生物 学 家 看 到 了 大 概 会 暗自 摇头 ， 但 我 们 毕竟 迈 出 
了 模拟 世界 的 第 一 步 。 


我 们 除了 用 数据 性 的 属性 来 分 辨 类 别 外 ， 有 时 也 会 根据 这 类 东西 
能 做 什么 事情 来 区 分 。 比 如 说 ， 乌 会 移动 。 这 样 ， 乌 就 和 房屋 的 类 别 
就 区 分 开 了 。 这 些 动 作 会 带 来 一 定 的 结果 ， 比 如 移动 导致 位 置 的 变 
化 。 这 样 的 一 些 “ 行 为 ”属性 称 为 方法 (method) 。Python 中 ， 一 般 通 
过 在 类 的 内 部 定义 函数 来 说 明 方 法 。 


Class Bird(object): 
feather = True 
reproduction = "egg" 
def chirp(self, sound): 


print(sound) 


我 们 给 乌 类 新 增 一 个 方法 属性 ， 就 是 表示 乌 叫 的 方法 chirp0。- 方 
法 chirpO 看 起 来 很 像 一 个 函数 。 它 的 第 一 个 参数 是 self， 是 为 了 在 方法 
内 部 引用 对 象 自身 ， 我 将 在 后 面 详 细 解释 。 需 要 强调 的 是 ， 无 论 该 参 
数 是 否 用 到 ， 方 法 的 第 一 个 参数 必须 是 用 于 指 代 对 象 自身 的 self。 剩 下 


的 参数 sound 是 为 了 满足 我 们 的 需求 设计 的 ， 它 代表 了 乌 叫 的 内 容 。 方 
法 chirpO 会 把 Sound 打印 出 来 。 


3. WR 


我 们 定义 了 类 ， 但 和 上 阔 数 定义 一 样 ， 这 还 只 是 打造 兵器 的 过 程 。 
为 了 使 用 这 个 利器 ， 我 们 需要 深入 到 对 象 的 层面 。 通 过 调用 类 ， 我 们 
可 以 创造 出 这 个 类 下 面 的 一 个 对 象 。 比 如 说 ， 我 养 了 一 只 小 鸡 ， 叫 
summer。 它 是 个 对 象 ， 且 属于 鸟 类 。 我 们 使 用 前 面 已 经 定义 好 的 乌 
类 ， 产 生 这 个 对 象 : 


summer = Bird() 


通过 这 一 句 创建 对 象 ， 并 说 明 summer 是 属于 乌 类 的 一 个 对 象 。 现 

在 ， 我 们 就 可 以 使 用 乌 类 中 已 经 写 好 的 代码 了 。 作 为 对 象 的 summer 将 

拥有 乌 类 的 属性 和 方法 。 对 属性 的 引用 是 通过 对 象 .属性 
(object.attribute) 的 形式 实现 的 。 比 如 说 : 


print(summer.reproduction) # FJEl'egg' 


用 上 面 的 方式 ， 我 们 得 到 summer 所 属 类 的 繁殖 方式 。 


此 外 ， 我 们 还 可 以 调用 方法 ， 让 summer 执 行 乌 类 人 允许 的 动作 。 比 
如 : 


summer .chirp("jijiji") # FJEN'jijiji' 


在 调用 方法 时 ， 我 们 只 传递 了 一 个 参数 ， 也 就 是 字符 串 " 放 这 "。 这 
正 是 方法 与 水 数 有 所 区 别 的 地 方 。 尽 管 在 定义 类 的 方法 时 ， 我 们 必须 
加 上 这 个 self 参 数 ， 但 self 只 用 能 在 类 定义 的 内 部 ， 所 以 在 调用 方法 时 
不 需要 对 self 传 入 数据 。 通 过 调用 chirp0 方 法 ， 我 的 summer 就 可 以 叫 
了 。 


到 现在 为 止 ， 描 述 对 象 的 数据 都 存储 于 类 的 属性 中 。 类 属性 描述 
了 一 个 类 的 共性 ， 比 如 乌 类 都 有 羽毛 。 所 有 属于 该 类 的 对 象 会 共享 这 
些 属性 。 比 如 说 ，summer 是 乌 类 的 一 个 对 象 ， 因 此 summer 也 有 汐 毛 。 
当然 ， 我 们 可 以 通过 某 个 对 象 来 引用 某 个 类 属性 。 


对 于 一 个 类 下 的 全 部 个 体 来 说 ， 某 些 属性 可 能 存在 个 体 差 异 。 比 
如 说 ， 我 的 summer 是 黄色 的 ， 但 并 非 所 有 的 乌 儿 都 是 黄色 的 。 再 比如 
说 人 这 个 类 。 人 性 别 是 某 个 人 的 一 个 性 质 ， 不 是 所 有 的 人 类 都 是 男 ， 或 
者 都 是 女 。 这 个 性 质 的 值 随 着 对 象 的 不 同 而 不 同 。 李 雷 是 人 类 的 一 个 
对 象 ， 性 别 是 男 。 韩 美美 也 是 人 类 的 一 个 对 象 ， 性 别 是 女 。 


因此 ， 为 了 完整 描述 个 体 ， 除 了 共性 的 类 属性 外 ， 我 们 还 需要 用 
于 说 明 个 性 的 对 象 属 性 。 在 类 中 ， 我 们 可 以 通过 self 来 操作 对 象 的 属 
性 。 现 在 我 们 拓展 Bird 类 : 


Class Bird(object): 
def chirp(self, sound): 
print(sound) 
def set_color(self, color): 


self.color = color 


summer = Bird() 
summer .set_color ("yellow") 


print(summer.color) # FJEN'yellow' 


在 方法 set_color0 中 ， 我 们 通过 self 参 数 设 定 了 对 象 的 属性 color。 
和 类 属性 一 样 ， 我 们 能 通过 对 象 .属性 的 方式 来 操作 对 象 属性 。 由 于 对 
象 属性 依赖 于 self， 所 以 我 们 必须 在 某 个 方法 内 部 才能 操作 类 属性 。 因 
此 ， 对 象 属性 没 办 法 像 类 属性 一 样 ， 在 类 下 方 直接 赋 初 值 。 


但 Python 还 是 提供 了 初始 化 对 象 属性 的 办 法 。Python 定 义 了 一 系 
列 特殊 方法 。 特 殊 方 法 又 被 称 为 魔法 方法 (Magic Method) 。 特 殊 方 
法 的 方法 名 很 特别 ， 前 后 有 两 个 下 男 线 ， 比 如 _ init O add O 
_ dict_0 等 。 程 序 员 可 以 在 类 定义 中 设 定 特殊 方法 。Python 会 以 特定 
的 方式 来 处 理 各 个 特殊 方法 。 对 于 类 的 _init_0) 方 法 ，Python 会 在 每 
次 创建 对 象 时 自动 调用 。 因 此 ， 我 们 可 以 在 _init_() 方 法 内 部 来 初始 
化 对 象 属性 : 


class Bird(object): 


def _ init__(self, sound): 
self.sound = sound 
print("my sound is:", sound) 
def chirp(self): 


print(self.sound) 


summer = Bird("ji") 


summer .chirp() # 打印 "ji 


在 上 面 的 类 定义 中 ， 我 们 通过 _init_ 0) 方法 说 明了 这 个 类 的 初始 
化 方式 。 每 当 对 象 建 立时 ， 比 如 创建 Summer 对象 时 ，_ init (方法 就 
会 被 调用 。 它 会 设 定 sound 这 个 对 象 属性 。 在 后 面 的 chirp() 方 法 中 ， 就 
可 以 通过 self 调 用 这 一 对 象 属性 。 除 了 设 定 对 象 属性 外 ， 我 们 还 可 以 在 
_init_0 中 加 入 其 他 指令 。 这 些 指令 会 在 创建 对 象 时 执行 。 在 调用 类 
时 ， 类 的 后 面 可 以 跟 一 个 参数 列表 。 这 里 放 入 的 数据 将 传 给 _init (0) 
的 参数 。 通 过 _init_() 方 法 ， 我 们 可 以 在 创建 对 象 时 就 初始 化 对 象 属 
性 。 


除了 操作 对 象 属 性 外 ，self 参 数 还 有 另外 一 个 功能 ， 就 是 能 让 我 们 
在 一 个 方法 内 部 调用 同一 类 的 其 他 方法 ， 比 如 : 


Class Bird(object): 
def chirp(self, sound): 


print(sound) 


def chirp_repeat(self, sound, n): 
for i in range(n): 


self.chirp(sound) 


summer = Bird() 


summer.chirp_repeat("ji", 10) # 重复 打印 'ji'10 次 


在 方法 chirp_repeat0 中 ， 我 们 通过 self 调 用 了 类 中 的 另 一 个 方法 
chirp()o 


4.2 ”继承 者 们 
1. 子 类 


类 别 本 身 还 可 以 进一步 细 分 成 子 类 。 比 如 说 ， 乌 类 可 以 进一步 分 
POS. AGS. MMR, RAR (Inheritance) 来 表达 
上 述 概念 。 


Class Bird(object): 
feather = True 
reproduction = "egg" 
def chirp(self, sound): 


print(sound) 


class Chicken(Bird): 
how_to_move= "walk" 


edible = True 


class Swan(Bird): 


how_to_move= "swim 


edible = False 


summer = Chicken() 
print(summer. feather ) # #JElTrue 


summer .chirp("ji") # 打印 "ji 


新 定义 的 鸡 (Chicken) 类 ， 增 加 了 两 个 属性 : 移动 方式 
(how to_move) 和 可 以 食用 (edible) 


在 类 定义 时 ， 括 号 里 为 Bird。 这 说 明 ， 鸡 类 是 属于 乌 类 (Bird) 
的 一 个 子 类 ， 即 Chicken 继 承 自 Bird。 自 然而 然 ， 乌 类 就 是 鸡 类 的 父 
X, Chicken 将 享有 Bird 的 所 有 属性 。 尽 管 我 们 只 声明 了 summer 是 鸡 
类 ， 但 它 通 过 继承 享有 了 父 类 的 属性 ， 比 如 数据 性 的 属性 feather， 还 
有 方法 性 的 属性 chirp()。 新 定义 的 天 牲 (Swan) 类 ， 同 样 继承 自 乌 
类 。 在 创建 一 个 天 鹅 对 象 时 ， 该 对 象 上 自动 拥有 乌 类 的 属性 。 


图 4-1 一 个 鸡 类 的 对 象 


很 明显 ， 我 们 可 以 通过 继承 来 减少 程序 中 的 重复 信息 和 重复 语 
句 。 如 果 我 们 分 别 定义 鸡 类 和 和 天鹅 类 ， 而 不 是 继承 自 乌 类 ， 就 必须 把 
鸟 类 的 属性 分 别 输入 到 鸡 类 和 天 鹅 类 的 定义 中 。 整 个 过 程 会 变 得 烦 
琐 ， 因 此 ， 继 承 提 高 了 程序 的 可 重复 使 用 性 。 最 基础 的 情况 ， 是 类 定 
义 的 括号 中 是 object。 类 object 其 实 是 Python 中 的 一 个 内 置 类 。 它 充当 
了 所 有 类 的 祖先 。 


分 类 往往 是 人 了 解 世界 的 第 一 步 。 我 们 将 各 种 各 样 的 东西 分 类 ， 
从 而 了 解 世界 。 从 人 类 祖先 开始 ， 我 们 就 在 分 类 。18 世 纪 是 航海 大 发 
现 的 时 代 ， 欧 洲 航 海 家 前 往 世界 各 地 ， 带 回来 闻所未闻 的 动 植物 标 
本 。 人 们 激动 于 大 量 出 现 的 新 物种 ， 但 也 头痛 于 如 何 分 类 。 卡 尔 : 林 奈 
提出 一 个 分 类 系统 ， 通 过 父 类 和 子 类 的 隶属 关系 ， 为 进一步 的 科学 发 
现 铺 平 了 道路 。 面 向 对 象 语 言及 其 继承 机 制 ， 正 是 模拟 人 的 有 意识 分 


类 过 程 。 


2. 属性 覆盖 


如 上 所 述 ， 在 继承 的 过 程 中 ， 我 们 可 以 在 子 类 中 增加 父 类 不 存在 
的 属性 ， 从 而 增强 子 类 的 功能 。 此 外 ， 我 们 还 可 以 在 子 类 中 替换 父 类 
已 经 存在 了 的 属性 ， 比 如 : 


Class Bird(object): 
def chirp(self): 


print("make sound") 


class Chicken(Bird): 


def chirp(self): 


print("ji") 
bird = Bird() 
bird.chirp() # 打印 'make sound' 


summer = Chicken( ) 


summer .chirp() # 打印 'make sound' 和 "ji 


鸡 类 (Chicken) 是 乌 类 (Bird) 的 子 类 。 在 鸡 类 (Chicken) 中 ， 
我 们 定义 了 方法 chirp0。 这 个 方法 在 乌 类 中 也 有 定义 。 通 过 调用 可 以 
看 出 ， 鸡 类 会 调用 自身 定义 的 chirp0) 方 法 ， 而 不 是 父 类 中 的 chirp() 方 
法 。 从 效果 上 看 ， 这 就 好 像 父 类 中 的 方法 chirp0) 被 子 类 中 的 同名 属性 
覆盖 (override) 了 一 样 。 


通过 对 方法 的 履 盖 ， 我 们 可 以 彻底 地 改变 子 类 的 行为 。 但 有 的 时 
候 ， 子 类 的 行为 是 父 类 行为 的 拓展 。 这 时 ， 我 们 可 以 通过 super 关 键 字 
在 子 类 中 调用 父 类 中 被 覆盖 的 方法 ， 比 如 : 


Class Bird(object): 
def chirp(self): 


print("make sound") 


class Chicken(Bird): 
def chirp(self): 


super().chirp() 


print("ji") 
bird = Bird() 
bird.chirp() # 打印 "make sound" 


summer = Chicken() 


summer .chirp() # 打印 "make sound" 和 "ji" 


在 鸡 类 的 chirp() 方 法 中 ， 我 们 使 用 了 super。 它 是 一 个 内 置 类 ， 能 
产生 一 个 指 代 父 类 的 对 象 。 通 过 super， 我 们 在 子 类 的 同名 方法 中 调用 
了 父 类 的 方法 。 这 样 ， 子 类 的 方法 既 能 执行 父 类 中 的 相关 操作 ， 又 能 
定义 属于 自己 的 额外 操作 。 


调用 super 的 语句 可 以 出 现在 子 类 方法 的 第 一 句 ， 也 可 以 出 现在 子 
类 方法 的 任意 其 他 位 置 。 


4.3 ”那些 年 ， 错 过 的 对 象 
1。 列 表 对 象 


我 们 从 最 初 的 "Hello World!"， 一 路 狂奔 到 对 象 面前 。 俗 话说 ， 人 
生 就 像 一 场 旅 行 ， 重 要 的 是 沿途 的 风景 。 事 实 上 ， 前 面 几 章 已 经 多 次 
出 现 对 象 。 只 不 过 ， 那 时 候 没 有 引入 对 象 的 概念 ， 所 以 只 能 遗憾 错 
过 。 是 时 候 回 头 看 看 ， 我 们 错过 的 那些 对 钱 了 。 


我 们 先 来 看 一 个 熟人 人， 数据 容器 中 的 列表 。 它 是 一 个 类 ， 用 内 置 
图 数 可 以 找到 类 的 名 字 : 


>>>a = [1, 2, 5, 3, 5] 


>>>type(a) 


根据 返回 的 结果 ， 我 们 知道 a 属于 list 类 型 ， 也 就 是 列表 类 型 。 其 
实 ， 所 谓 的 类 型 就 是 对 象 所 属 的 类 的 名 字 。 每 个 列表 都 属于 这 个 list 
类 。 这 个 类 是 Python 自 带 的 ， 已 经 提前 定义 好 的 ， 所 以 称 为 内 置 类 。 
当 我 们 新 建 一 个 表 时 ， 实 际 上 是 在 创建 list 类 的 一 个 对 象 。 我 们 还 可 以 
用 其 他 两 个 内 置 图 数 来 进一步 调查 类 的 信息 : dir0 和 help0。 函 数 dir0) 
用 来 查询 一 个 类 或 者 对 象 的 所 有 属性 。 你 可 以 尝试 一 下 : 


>>>dir (list) 


我 们 已 经 用 heljp0 函 数 来 查询 了 函数 的 说 明文 档 。 它 还 可 以 用 于 显 
示 类 的 说 明文 档 。 你 可 以 尝试 一 下 : 


>>>help(list) 


返回 的 不 但 有 关于 list 类 的 描述 ， 还 简略 说 明了 它 的 各 个 属性 。 顺 
便 提 一 下 ， 制 作 类 的 说 明文 档 的 方式 ， 与 制作 函数 说 明文 档 类 似 ， 我 
们 只 需 在 类 定义 下 用 多 行 字 符 串 加 入 自己 想 要 的 说 明 就 可 以 了 : 


class HelpDemo(object): 
This is a demo for using help() on a class 
pass 


print(help(HelpDemo) ) 


程序 中 的 pass 是 Python 的 一 个 特殊 关键 字 ， 用 于 说 明 在 该 语法 结 
构 中 “什么 都 不 做 ”"。 这 个 关键 字 保持 了 程序 结构 的 完整 性 。 


通过 上 面 的 查询 ， 我 们 看 到 类 还 有 许多 “隐藏 技能 ”。 比 如 下 面 一 
些 list 的 方法 ， 可 以 返回 列表 的 信息 : 


>>>a = [1, 2, 3, 5, 9.0, "Good", -1, True, False, "Bye" |] 


>>>a.count (5) # 计数 ， 看 总 共有 多 少 个 元 素 5 
>>>a,index(3) # 查询 元 素 3 第 一 次 出 现时 的 下 标 


有 些 方 法 还 允许 我 们 对 列表 进行 修改 操作 : 


>>>a.append(6) # 在 列表 的 最 后 增添 一 个 新 元 素 6 
>>>a.sort() # HER 

>>>a.reverse() # EERE 

>>>a.pop() # 去 除 最 后 一 个 元 素 ， 并 将 该 元 素 返 回 。 
>>>a,remove(2) # 去 除 第 一 次 出 现 的 元 素 2 
>>>a.insert(0,9) # 在 下 标 为 9 的 位 置 插入 9 
>>>a.clear() # 清空 列表 


通过 对 方法 的 调用 ， 列 表 的 功能 大 为 增强 。 再 次 从 对 象 的 角度 来 
认识 列表 ， 感 觉 束 像 一 次 美好 的 聚会 。 


2. 元 组 与 字符 串 对 象 


元 组 与 列表 一 样 ， 都 是 序列 。 但 元 组 不 能 变更 内 容 。 因 此 ， 元 组 
只 能 进行 查询 操作 ， 不 能 进行 修改 操作 : 


>>>a = (4, 3, 5) 


>>>a.count(5) # 计数 ， 看 总 共有 多 少 个 元 素 5 
>>>a,index(3) # 查询 元 素 3 第 一 次 出 现时 的 下 标 


字符 串 是 特殊 的 元 组 ， 因 此 可 以 执行 元 组 的 方法 : 


>>>a="abc" 


>>>a.index("c") 


尽管 字符 串 是 元 组 的 一 种 ， 但 字符 串 (string) 有 一 些 方法 能 改变 
字符 串 。 这 听 起 来 似乎 违背 了 元 组 的 不 可 变性 。 其 实 ， 这 些 方法 并 不 
是 修改 字符 串 对 象 ， 而 是 删除 原 有 字符 串 ， 再 建立 一 个 新 的 字符 串 ， 
所 以 并 疫 有 违背 元 组 的 不 可 变性 。 


下 面 总 结 了 字符 串 对 象 的 方法 。str 为 一 个 字符 串 ，sub 为 str 的 一 个 
子 字 符 串 。s 为 一 个 序列 ， 它 的 元 素 都 是 字符 串 。width 为 一 个 整数 ， 
用 于 说 明 新 生成 字符 串 的 宽度 。 这 些 方法 经 常用 于 字符 串 的 处 理 。 


>>>str = "Hello World!" 


>>>sub = "World" 


>>>str .count (sub) # 返回 : sub 在 str 中 出 现 的 次 数 


>>>str.find(sub) # 返回 : 从 左 开始 ， 查 找 sub 在 str 中 第 一 次 出 
现 的 位 置 。 

# 如 果 str 中 不 包含 suUb， 返 回 -1 
>>>str.index(sub) # 返回 : 从 左 开 始 ， 查 找 sub 在 str 中 第 一 次 出 
现 的 位 置 。 

# 如 果 str 中 不 包含 sub， 举 出 错误 
>>>str.rfind(sub) # 返回 : 从 右 开 始 ， 查 找 sub 在 str 中 第 一 次 出 
现 的 位 置 

# 如 果 str 中 不 包含 suUb， 返 回 -1 
>>>str.rindex(sub) # 返回 : 从 右 开始 ， 查 找 sub 在 str 中 第 一 次 出 
现 的 位 置 

# 如 果 str 中 不 包含 sub ， 举 出 错误 
>>>str.isalnum() # 返回 : True， 如 果 所 有 的 字符 都 是 字母 或 数 
字 
>>>str.isalpha() # 返回 : True， 如 果 所 有 的 字符 都 是 字母 
>>>str.isdigit() # 返回 : True， 如 果 所 有 的 字符 都 是 数字 
>>>str.istitle() # 返回 : True， 如 果 所 有 的 词 的 首 字母 都 是 大 
写 
>>>str.isspace() # 返回 : True， 如 果 所 有 的 字符 都 是 空 
>>>str.islower() # 返回 : True， 如 果 所 有 的 字符 都 是 小 写字 母 
>>>str.isupper() # 返回 : True， 如 果 所 有 的 字符 都 是 大 写字 母 


>>>str.split([sep, [max]]) # 返回 : 从 左 开 始 ， 以 空格 为 分 隔 符 
(separator) , # 将 Str 分 割 为 多 个 子 字符 串 ， 总 共 分 割 nax 次 。# 将 所 得 的 子 字 
符 串 放 在 一 个 表 中 返回 。 可 以 以 

# str .split(", ") 的 方式 使 用 其 他 分 


Batt 
>>>str.rsplit([sep, [max]]) # 返回 : 从 右 开 始 ， 以 空格 为 分 隔 符 
(separator) , # 将 str 分 割 为 多 个 子 字符 串 ， 总 共 分 割 max 次 。# 将 所 得 的 子 字 
符 串 放 在 一 个 表 中 返回 。 可 以 以 

# str ,rsplit(",") 的 方式 使 用 其 他 
分 隔 符 
>>>str.join(s) # 返回 : 将 s 中 的 元 素 ， 以 str 为 分 隔 符 ， 

# 合并 成 为 一 个 字符 串 。 
>>>str.strip([sub]) # 返回 : 去 掉 字 符 串 开头 和 结尾 的 空格 。 

# 也 可 以 提供 参数 sub ， 去 掉 位 于 字符 串 开 头 和 结尾 

的 sub 
>>>str.replace(sub, new_sub) # 返回 : 用 一 个 新 的 字符 串 new_sub 替 换 
str 中 


# 的 sub 
>>>str.capitalize() # 返回 : 将 str 第 一 个 字母 大 写 
>>>str.lower() # 返回 : 将 str 全 部 字母 改 为 小 写 
>>>str.upper() # 返回 : 将 str 全 部 字母 改 为 大 写 
>>>str.swapcase() # 返回 : 将 str 大 写字 母 改 为 小 写 ， 小 写字 
母 改 为 大 写 
>>>str.title() # 返回 : 将 str 的 每 个 词 (以 空格 分 隔 ) 的 
首 字 母 # 大 写 
>>>str.center (width) # 返回 : 长 度 为 width 的 字符 串 ， 将 原 字符 
串 放 入 # 该 字符 串 中 心 ， 其 他 空余 位 置 为 空格 。 
>>>str.ljust(width) # 返回 : 长 度 为 width 的 字符 串 ， 将 原 字 符 串 左 对 # 
齐 放 入 该 字符 串 ， 其 他 空余 位 置 为 空格 。 
>>>str.rjust(width) # 返回 : 长 度 为 width 的 字符 串 ， 将 原 字 符 串 右 对 


齐 放 入 # 该 字符 串 ， 其 他 空余 位 置 为 空格 。 


>>>example_ dict = {"a":1, "b":2} 


>>>type(example_dict) 


我 们 可 以 通过 词典 的 keys() 方 法 ， 来 循环 遍历 每 个 元 素 的 键 : 


for k in example_dict.keys(): 


print(example_dict[k]) 


通过 values() 方 法 ， 可 以 遍历 每 个 元 素 的 值 。 或 者 用 items 方 法 ， 直 
接 人 遍历 每 个 元 素 : 


for v in example_dict.values(): 


print(v) 


for k,v in example_dict.items(): 


print(k, v) 


我 们 也 可 以 用 clear() 方 法 ， 清 空 整个 词典 : 


example_dict.clear() # ja=example dict, example_dictS 


为 人 } 


4.4” 意 想不到 的 对 象 
1. 循环 对 象 


Python 中 的 许多 语法 结构 都 是 由 对 象 实现 的 ， 循 环 就 可 以 通过 对 
象 实现 。 循 环 对 象 并 不 是 在 Python 诞生 之 初 就 存在 的 ， 但 它 的 发 展 极 
为 迅速 ， 特 别 是 在 Python 3 时 代 ， 循 环 对 象 正 在 成 为 循环 的 标准 形 
To 


那么 ， 什 么 是 循环 对 象 呢 ? 所 谓 的 循环 对 象 包含 有 一 个 _next_() 
方法 久 。 这 个 方法 的 目的 是 生成 循环 的 下 一 个 结果 。 在 生成 过 循环 的 
所 有 结果 之 后 ， 该 方法 将 抛 出 StopIteration 寞 冲 。 


当 一 个 像 for 这 样 的 循环 语法 调用 循环 对 象 时 ， 它 会 在 每 次 循环 的 
时 候 调 用 _next_ (0) 方 法， 直到 StopIteration 出 现 。 循 环 接 收 到 这 个 异 
单 ， 就 会 知道 循环 已 经 结束 ， 将 停止 调用 _next，()。 


我 们 用 内 置 阔 数 iter0 把 一 个 列表 转变 为 循环 对 象 。 这 个 循环 对 象 
将 拥有 _ next_ 0) 方法。 我们 多 次 调用 _next (0 方法， 将 不 断 返 回 列 
表 的 值 ， 直 到 出 现 异常 : 


>>>example_iter = iter([1, 2]) 
>>>example_iter.__next__() # 显示 1 
>>>example_iter.__next__() # 显示 2 


>>>example_iter.__next__() # 出 现 StopIteration 异 常 。 


我 们 上 面 重 复 调 用 next () 的 过 程 ， 就 相当 于 手动 进行 了 循环 。 
我 们 可 以 把 循环 对 象 包 襄 在 for 中 目 动 进行 循环 : 


for itemin iter([1, 2]): 


print(item) 


在 这 里 ，for 结 构 自 动 调用 _next 0 方法 ， 将 该 方法 的 返回 值 赋 
予 给 item。 循环 知道 出 现 StopIteration 的 时 候 结 束 。 当 然 ， 我 们 可 以 省 
去 内 置 函 数 iter 的 转换 。 这 是 因为 ，for 结 构 会 自动 执行 这 一 转换 人 )。 


相对 于 序列 ， 循 环 对 象 的 好 处 在 于 : 不 用 在 循环 还 没 开始 的 时 
候 ， 束 生成 要 使 用 的 元 素 。 所 有 要 使 用 的 元 素 可 以 在 循环 过 程 中 逐渐 
生成 。 这 样 ， 不 仅 节 省 了 空间 ， 提 高 了 效率 ， 还 会 使 编程 更 加 灵活 。 


我 们 可 以 借助 生成 器 (generator) 来 自 定义 循环 对 象 。 生 成 器 的 
编写 方法 和 函数 定义 类 似 ， 只 是 在 return 的 地 方 改 为 yield。 生 成 器 中 可 
以 有 多 个 yield。 当 生成 器 遇 到 一 个 yield 时 ， 会 暂停 运行 生成 器 ， 返 回 
yield 后 面 的 值 。 当 再 次 调用 生成 器 的 时 候 ， 会 从 刚才 暂停 的 地 方 继续 


运行 ， 直 到 下 一 个 yield。 生 成 器 自身 又 构成 一 个 循环 对 象 ， 每 次 循环 
使 用 一 个 yield 返 回 的 值 。 


下 面 是 一 个 生成 器 : 


def gen(): 
a = 100 
yield a 
a = a 8 
yield a 
yield 1000 


该 生成 器 共有 三 个 yield， 如 果 用 作 循 环 对 象 时 ， 会 进行 三 次 循 
环 。 


for i in gen(): 


print(i) 


再 考虑 下 面 一 个 生成 器 : 


def gen(): 


i=0 


while i < 10000000: 
i=i+1 


yield i 


这 个 生成 器 能 产生 10 000 000 个 元 素 。 如 果 先 创建 序列 保存 这 10 
000 000 个 元 素 ， 再 循环 遍历 ， 那 么 这 个 序列 将 占用 大 量 的 空间 。 出 于 
同样 的 原因 ，Python 中 的 内 置 国 数 range0 返 回 的 是 一 个 循环 对 象 ， 而 
不 是 一 个 序列 多。 


2. RAR 


前 面 说 过 ， 在 Python 中 , 国 数 也 是 一 种 对 象 。 实际 上 ， 任何 一 个 
有 _ call_0 特 殊 方 法 的 对 象 都 被 当 作 是 函数。 比如 下 面 的 例子 : 


class SampleMore(object): 
def _ call (self, a): 


returna + 5 


add_five = SampleMore() # ERAR R 
print(add_five(2)) HRT RAA RRR, BRA 
To 


add_five 为 SampleMore 类 的 一 个 对 象 ， 当 被 调用 时 ，add_five 执 行 
加 5 的 操作 。 


我 们 将 在 第 7 章 中 深入 研究 国 数 对 象 。 


3。 模 块 对 象 


前 面 说 过 ，Python 中 的 模块 对 应 一 个 .py 文件 。 模 块 也 是 对 象 。 比 
如 ， 我 们 直接 引入 标准 库 中 的 模块 tme: 


import time 


print(dir(time) ) 


可 以 看 到 ，time 有 很 多 属性 可 以 调用 ， 例 如 sleep0) 方 法 。 我 们 之 前 
用 import 语 句 引 入 其 他 文件 中 定义 的 函数 ， 实 际 上 就 是 引入 模块 对 象 
的 属性 ， 比 如 : 


from time import sleep 


sleep(10) 


print("wake up") 


模块 time 的 sleep0 会 中 止 程序 。 调 用 时 的 参数 说 明 给 了 中 止 的 时 
间 。 我 们 还 可 以 用 简单 暴力 的 方法 ， 一 次 性 引入 模块 的 所 有 属性 : 


from time import * 


sleep(10) 


既然 知道 了 sleep() 是 time 的 一 个 方法 ， 那 么 我 们 当然 可 以 利用 对 
象 .属性 的 方式 来 调用 它 。 


import time 


time.sleep(10) 


我 们 在 调用 方法 时 附带 上 了 对 象 名 。 这 样 做 的 好 处 是 可 以 拓展 程 
序 的 命名 空间 ， 避 免 同名 冲突 。 例 如 ， 如 果 两 个 模块 中 都 有 sleep() 方 
法 ， 那 么 我 们 可 以 通过 不 一 样 的 模块 名 来 区 分 开 来 。 在 my_time.py 中 
BAK: 


def sleep(self): 


print("I am sleeping.") 


在 main.py 中 引入 内 置 模块 tme 和 自 定 义 模块 my_time: 


import time 


import my_time 


time.sleep( ) 


my_time.sleep() 


上 面 的 两 次 对 sleep() 方 法 的 调用 中 ， 我 们 通过 对 象 名 区 分 出 了 不 
fA) AYsleep()o 


在 引入 模块 时 ， 我 们 还 可 以 给 模块 换个 名 字 : 


import time as t 


t.sleep(10) 


在 引入 名 字 较 长 的 模块 时 ， 这 个 换 名 字 的 办 法 能 有 效 地 挽救 程序 
员 的 手指 。 


可 以 将 功能 相似 的 模块 放 在 同一 个 文件 夹 中 ， 构 成 一 个 模块 包 。 
比如 放 在 this_dir 中 : 


import this_dir.module 


引入 this_dir 文 件 夹 中 的 module 模 块 。 


该 文件 夹 中 必须 包含 一 个 _init_.py 的 文件 ， 提 醒 Python， 该 文件 
夹 为 一 个 模块 包 。__init _.py 可 以 是 一 个 空 文件 。 


每 个 模块 对 象 都 有 一 个 _name 属性 ， 用 来 记录 模块 的 名 字 ， 例 
如 : 


import time 


print(time. name ) 


当 一 个 .py 文件 作为 主 程序 运行 时 ， 比 如 python foo.py， 这 个 文件 
也 会 有 一 个 对 应 的 模块 对 象 。 但 这 个 模块 对 象 的 _name 属性 会 
是 ” main "。 因 此 ， 我 们 在 很 多 .py 文件 中 可 以 看 到 下 面 的 语句 : 


if _name__ == "__main__": 


它 的 意思 是 说 ， 如 果 这 个 文件 作为 一 个 主 程序 运行 ， 那 么 将 执行 
下 面 的 操作 。 有 的 时 候 ， 一 个 .py 文件 中 同时 有 类 和 对 象 的 定义 ， 以 及 
对 它们 的 调用 。 当 这 些 .py 文件 作为 库 引 入 时 ， 我 们 可 能 并 不 希望 执行 
这 些 调用 。 通 过 把 调用 语句 放 到 上 面 的 if 中， 就 可 以 在 调用 时 不 执行 
这 些 调用 语句 了 。 


4. 异常 对 象 


前 面 我 们 提 到 过 ， 可 以 在 程序 中 加 入 异常 处 理 的 try 结 构 ， 捕 捉 程 
序 中 出 现 的 异常 。 实 际 上 ， 我 们 捕捉 到 的 也 是 一 个 对 象 ， 比 如 : 


try: 
m = 1/0 
except ZeroDivisionError as e: 


print("Catch NameError in the sub-function" ) 


print(type(e)) # BAYA" exceptions.ZeroDivisionError" 
print(dir(e)) # 异常 对 象 的 属性 

print(e.message) # 异常 信息 integer division or modulo by 
zero 


All except... as... 的 语法 ， 我 们 在 except 结 果 中 用 e 来 代表 捕获 到 
的 类 型 对 象 。 关 键 字 except 直 接 跟 随 的 ZeroDivisionError 实 际 上 是 异常 
对 象 的 类 。 正 因为 如 此 ， 我 们 在 举 出 异常 时 会 创建 一 个 异常 对 象 : 


raise ZeroDivisionError() 


在 Python 中 ， 循 环 、 函 数 、 模 块 、 异 常 都 是 某 种 对 象 。 当 然 ， 我 
们 可 以 完全 按照 面向 过 程 中 的 方式 来 调用 这 些 语法 ， 而 不 必 关 注 它 们 


底层 的 对 象 模型 。 但 出 于 学 习 的 目的 ， 这 些 语 法 结构 的 对 象 模型 能 加 
深 我 们 对 Python 的 理解 。 


附录 A 代码 规范 


类 的 命名 采用 首 字母 大 写 的 英文 单词 。 如 果 由 多 个 单词 连接 而 
成 ， 则 每 个 单词 的 首 字母 都 大 写 。 单 词 之 间 不 出 现下 男 线 。 


对 象 名 、 属 性 名 和 方法 名 ， 全 部 用 小 写字 母 。 单 词 之 间 用 下 男 线 
连接 。 


(1) “模拟 ”的 英文 是 Simulation。 

(2) 在 Python 2.7 中 ， ”next 0 方法 的 名 字 是 next() 方 法 。 

(3) 在 Python 2.7 的 for 循 环 中 ，Python 直 接 从 序列 出 对 象 ， 序 列 不 会 转换 成 循环 对 象 。 
(4) 在 Python 2.7 中 ，range() 返 回 的 确实 是 一 个 序列 。 
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了 解 面 向 对 象 编 程 的 基础 之 后 ， 我 们 就 可 以 利用 Python 中 多 种 多 
样 的 对 象 了 。 这 些 对 象 能 提供 丰富 的 功能 ， 正 如 本 章 我 们 将 看 到 的 文 
件 读 写 、 时 间 日 期 管理 、 正 则 表达 式 和 网 络 伶 虫 。 熟 悉 了 这 些 功 能 强 
大 的 对 象 后 ， 我 们 就 可 以 实现 很 多 有 用 的 功能 了 。 用 程序 来 实现 这 些 
功能 ， 并 在 电脑 上 实际 运行 ， 才 是 编程 的 趣味 所 在 。 


5.1 存储 
1。 文 件 


我 们 知道 ，Python 中 的 数据 都 保存 在 内 存 中 。 当 电脑 断 电 时 ， 就 
好 像 患 了 失忆 症 ， 内 存 中 的 数据 就 会 消失 。 另 一 方面 ， 如 果 Python 程 
序 运 行 结束 ， 那 么 分 配给 这 个 程序 的 内 存 空间 也 会 清空 。 为 了 长 期 持 
续 地 存储 ，Python 必 须 把 数据 存储 在 磁盘 中 。 这 样 ， 即 使 断 电 或 程序 
结束 ， 数 据 依然 存在 。 


磁盘 以 文件 为 单位 来 存储 数据 。 对 于 计算 机 来 说 ， 数 据 的 本 质 就 
是 有 序 的 二 进 制 数 序列 。 如 果 以 字 节 为 单位 ， 也 就 是 每 8 位 二 进 制 数 序 
列 为 单位 ， 那 么 这 个 数据 序列 就 称 为 文本 。 这 是 因为 ，8 位 的 二 进 制 数 
序列 正好 对 应 ASCII 编 码 中 的 一 个 字符 。 而 Python 能 够 借助 文本 对 象 来 
读 与 文件 。 


在 Python 中 ， 我 们 可 以 通过 内 置 钞 效 open 来 创建 文件 对 象 。 在 调 
用 open 时 ， 需 要 说 明文 件 名 ， 以 及 打开 文件 的 方式 : 


f = open( 文 件 名 , 方式 ) 


文件 名 是 文件 存在 于 磁盘 的 名 字 ， 打 开 文 件 的 常用 方式 有 : 


"r" # 读 取 已 经 存在 的 文件 
"Ww" # 新 建文 件 ， 并 写 入 
"a" # 如 果 文 件 存在 ， 那 么 写 入 到 文件 的 结尾 。 如 果 文 件 不 存在 ， 则 新 建文 件 并 写 入 


例如 : 


>>>f = open("test.txt","r") 


就 是 用 只 读 的 方式 ， 打 开 了 一 个 名 为 test.txt 的 文件 。 


通过 上 面 返 回 的 对 象 ， 我 们 可 以 读 取 文 件 : 


content = f.read(10) # 读 取 10 个 字 节 的 数据 
content = f.readline() # 读 取 一 行 
content = f.readlines() # 读 取 所 有 行 ， 储 存在 列表 中 ， 每 个 元 素 是 一 


行 。 


如 果 以 "w" 或 "a" 方 式 打开 ， 那 么 我 们 可 以 写 入 文本 : 


f = open("test.txt", "w") 
f.write("I like apple") # 将 "I like apple" 写 入 文件 


如 果 想 写 入 一 行 ， 则 需要 在 字符 串 末 尾 加 上 换行 符 。 在 UNIX 系 统 
中 ， 换 行 符 为 "nm"。 在 Windows 系 统 中 ， 换 行 符 为 "\r\n"。 


f.write("I like apple\n") # UNIX 


f.write("I like apple\r\n") # Windows 


打开 文件 端口 将 占用 计算 机 资产， 因此， 在读 写 完成 后 ， 应 该 及 
时 的 用 文件 对 象 的 close 方 法 关闭 文件 : 


f.close() 


2. 上下文 管 理 器 


文件 操作 常常 和 上 下 文 管理 器 一 起 使 用 。 上 下 文 管理 器 (context 
manager) 用 于 规定 某 个 对 象 的 使 用 范围 。 一 旦 进入 或 者 离开 该 使 用 范 
围 ， 则 会 有 特殊 操作 被 调用 ， 比 如 为 对 象 分 配 或 者 释放 内 存 。 上 下 文 


管理 器 可 用 于 文件 操作 。 对 于 文件 操作 来 说 ， 我 们 需要 在 读 写 结束 时 
关闭 文件 。 程 序 员 经 常会 志 记 关闭 文件 ， 无 谓 的 占用 资源 。 上 下 文 管 
理 器 可 以 在 不 需要 文件 的 时 候 ， 上 自动 天 闭 文件 。 


下 面 是 一 段 单 规 的 文件 操作 程序 : 


# 常规 文件 操作 

f = open("new.txt", "w") 

print(f.closed) # 检查 文件 是 否 打 开 
f.write("Hello World!") 

f.close() 


print(f.closed) # #JElTrue 


如 果 我 们 加 入 上 下 文 管理 器 的 语法 ， 就 可 以 把 程序 改写 为 : 


# 使 用 上 下 文 管理 器 
with open("new.txt", "w") as f: 


f.write("Hello World!") 


print(f.closed) 


第 二 段 程 序 就 使 用 了 with...as... 结 构 。 上 下 文 管理 器 有 隶属 于 它 的 
程序 块 ， 当 隶属 的 程序 块 执行 结束 时 ， 也 就 是 语句 不 再 缩 进 时 ， 上 下 


文 管理 器 就 会 自动 关闭 文件 。 在 程序 中 ， 我 们 调用 了 fclosed 属 性 来 验 
证 是 否 已 经 关闭 。 通 过 上 下 文 管理 器 ， 我 们 相当 于 用 缩 进 来 表达 文件 
对 象 的 打开 范围 。 对 于 复杂 的 程序 来 说 ， 缩 进 的 存在 能 让 程序 员 更 清 
楚 地 意识 到 文件 在 哪些 阶段 打开 ， 减 少 志 记 关闭 文件 的 可 能 性 。 


上 面 的 上 下 文 管理 器 基于 f 对 象 的 ”exit () 特 殊 方 法 。 使 用 上 下 文 
管理 器 的 语法 时 ，Python 会 在 进入 程序 块 之 前 调用 文件 对 象 的 
enter () 方 法， 在 结束 程序 块 的 时 候 调 用 文件 对 象 的 ”exit_() 方 
法 。 在 文件 对 象 的 _exit 0 方法 中 ， 有 self.close() 语 句 。 因 此 ， 在 使 
用 上 下 文 管理 器 时 ， 我 们 融 不 用 明文 关闭 文件 了 。 


任何 定义 了 __enter_ 0 方法 和 ”exit 0 方法 的 对 象 都 可 以 用 于 上 
下 文 管理 器 。 下 面 ， 我 们 自 定 义 一 个 类 Vow， 并 定义 它 的 _enter_ 0 方 
法 和 ”exit_0 方 法。 因此， 由 Vow 类 的 对 象 可 以 用 于 上 下 文 管理 器 : 


class Vow(object): 
def _ init__(self, text): 
self.text = text 
def _enter_ (self): 
self.text = "I say: " + self.text # 增加 前 缀 
return self # 返回 一 个 对 象 
def _ exit__(self,exc_type, exc_value, traceback): 


self.text = self.text + "I!" # 增 加 后 缀 


with Vow("I'm fine") as myVow: 


print (myVow. text) 


print(myVow.text) 


运行 结果 如 下 : 


I say: I'm fine 


I say: I'm fine! 


初始 化 对 象 时 ， 对 象 的 text 属 性 是 "Tm fine"。 我 们 可 以 看 到 ， 在 进 
入 上 下 文 和 离开 上 下 文 时 ， 对 象 调 用 了 __enter_(0) 方 法 和 __exit_() 方 
法 ， 从 而 造成 对 象 的 text 属 性 改变 。 


_ enter_(0 返 回 一 个 对 象 。 上 下 文 管理 器 会 使 用 这 一 对 象 作 为 as 所 
指 的 变量 。 我 们 自 定 义 的 _enter_0 返 回 的 是 sealf， 也 就 是 新 建 的 Vow 
类 对 象 本 身 。 在 _enter (0 中， 我 们 为 text 属 性 增加 了 前 缀 "I say:"。 在 
exit _() 中 ， 我 们 为 text 属 性 增加 了 后 缀 "!"。 


值得 注意 的 是 ， __exit_() 有 四 个 参数 。 当 程序 块 中 出 现 异常 时 ， 
exit _() 参 数 中 的 exc_type、exc_value、traceback 用 于 描述 异常 。 我 
们 可 以 根据 这 三 个 参数 进行 相应 的 处 理 。 如 果 正 常 运行 结束 ， 则 这 三 


个 参数 都 是 None。 


3。pickle 包 


我 们 能 把 文本 存 于 文件 。 但 Python 中 最 常见 的 是 对 象 ， 当 程序 结 
束 或 计算 机 关机 时 ， 这 些 存 在 于 内 存 的 对 象 会 消失 。 那 么 ， 我 们 能 否 
把 对 象 保存 到 磁盘 上 呢 ? 


利用 Python 的 pickle 包 就 可 以 做 到 这 一 点 。 英 文 里 ，pickle 是 腌 菜 
的 意思 。 大 航海 时 代 的 海员 们 常 把 蔬菜 做 成 腌 菜 ， 装 在 钠 头 里 带 着 
走 。Python 中 的 pickle 也 有 类 似 的 意思 。 通 过 pickle 包 ， 我 们 可 以 把 某 
个 对 象 保 存 下 来 ， 再 存 成 磁盘 里 的 文件 。 


实际 上 ， 对 象 的 存储 分 为 两 步 。 第 一 步 ， 我 们 将 对 象 在 内 存 中 的 
数据 直接 抓 取出 来 ， 转 换 成 一 个 有 序 的 文本 ， 即 所 谓 的 序列 化 
(Serialization) 。 第 二 步 ， 将 文本 存 入 文件 。 等 到 需要 时 ， 我 们 从 文 
件 中 读 出 文本 ， 再 放 入 内 存 ， 就 可 以 获得 原 有 的 对 象 。 下 面 是 一 个 具 
体 的 例子 ， 首 先是 第 一 步 序 列 化 ， 将 内 人 存 中 的 对 象 转换 为 文本 流 : 


import pickle 


Class Bird(object): 
have_feather = True 


reproduction_method = "egg" 


summer = Bird() # 创建 对 象 
pickle_string = pickle.dumps(summer) # 序列 化 对 象 


使 用 pickle 包 的 dumps() 方 法 可 以 将 对 象 转换 成 字符 串 的 形式 。 随 
后 我 们 用 字 节 文本 的 存储 方法 ， 将 该 字符 串 储存 在 文件 。 继 续 第 二 


with open("summer.pkl", "wb") as f: 


f.write(pickle_string) 


上 面 程序 故意 分 成 了 两 步 ， 以 便 更 好 地 展示 整个 过 程 。 其 实 ， 我 
们 可 以 使 用 dump() 的 方法 ， 一 次 完成 两 步 : 


import pickle 


Class Bird(object): 
have_feather = True 


reproduction_method = "egg" 


summer = Bird() 
with open("summer.pkl", "w") as f: 


pickle.dump(summer, f) # 序列 化 并 保存 对 象 


对 象 Summer 将 存储 在 文件 summerpk 中 。 有 了 这 个 文件 ， 我 们 就 
可 以 在 必要 的 时 候 读 取 对 象 了 。 读 取 对 象 与 存储 对 象 的 过 程 正 好 相 
反 。 首 先 ， 我 们 从 文件 中 读 出 文本 。 然 后 使 用 pickle 的 loads() 方 法 ， 将 
字符 串 形式 的 文本 转换 为 对 象 。 我 们 也 可 以 使 用 pickle 的 load0 的 方 
法 ， 将 上 面 两 步 合 并 。 


有 时 候 ， 仅 仅 是 反 向 恢复 还 不 够 。 对 象 依赖 于 它 的 类 ， 所 以 
Python 在 创建 对 象 时 ， 需 要 找到 相应 的 类 。 因 此 当 我 们 从 文本 中 读 取 
对 象 时 ， 程 序 中 必须 已 经 定义 过 类 。 对 于 Python 总 是 存在 的 内 置 类 ， 
如 列表 、 词 典 、 字 符 串 等 ， 不 需要 再 在 程序 中 定义 。 但 对 于 用 户 自 定 
义 的 类 ， 就 必须 要 先 定 义 类 ， 然 后 才能 从 文件 中 载 入 该 类 的 对 象 。 下 
面 是 一 个 读 取 对 象 的 例子 : 


import pickle 


class Bird(object): 


have_feather = True 
reproduction_method = "egg" 
with open("summer.pkl", "rb") as f: 


summer = pickle.load(f) 


print(summer.have_feather ) # #JElTrue 


5.2 ”一 寸 光阴 


1。time 包 


计算 机 可 以 用 来 计时 。 从 硬件 上 来 说 ， 计 算 机 的 主板 上 有 一 个 计 
时 的 表 。 我 们 可 以 手动 或 者 根据 网 络 时 间 来 调 表 。 这 块 表 有 自己 的 电 
池 ， 所 以 即使 断 电 ， 表 也 不 会 停 。 在 硬件 的 基础 上 ， 计 算 机 可 以 提供 
挂钟 时 间 (Wall Clock Time) 。 挂 钟 时 间 是 从 某 个 固定 时 间 起 点 到 现 
在 的 时 间 间 隔 。 对 于 UNIX 系 统 来 说 ， 起 点 时 间 是 1970 年 1 月 1 日 的 0 点 0 
分 0 秒 。 其 他 的 日 期 信息 都 是 从 挂钟 时 间 计 算得 到 的 。 此 外 ， 计 算 机 还 
可 以 测量 CPU 实际 运行 的 时 间 ， 也 就 是 处 理 器 时 间 (Processor Clock 
Time) ， 以 测量 计算 机 性 能 。 当 CPU 处 于 闲置 状态 时 ， 处 理 器 时 间 会 


暂 俘 。 


我 们 能 通过 Python 编程 来 管理 时 间 和 上 日期。 标准 库 的 time 包 提供 
了 基本 的 时 间 功 能 。 下 面 使 用 time 包 .: 


import time 


print(time.time())  # 挂钟 时 间 ， 单 位 是 秒 


还 能 借助 模块 time 测 量程 序 运 行 时 间 。 比 如: 


import time 


start = time.clock() 
for i in range(100000): 


print(I 2) 


end = time.clock() 


print(end - start) 


EAER AS A RelockOAE, MM Bw ear Ail ey 
所 用 的 时 间 。 在 不 同 的 计算 机 系统 上 ，clock0O 的 返回 值 会 有 所 不 同 。 
在 UNIX 系 统 上 ， 返 回 的 是 处 理 器 时 间 。 当 CPU 处 于 闲置 状态 时 ， 处 理 
器 时 间 会 暂停 。 因 此 ， 我 们 获得 的 是 CPU 运行 时 间 。 在 windows 系 统 
上 ， 返 回 的 则 是 挂钟 时 间 。 


方法 sleepO 可 以 让 程序 休眠 。 根 据 sleepO 接 收 到 的 参数 ， 程 序 会 在 
某 时 间 间 隔 之 后 醒 来 继续 运行 : 


import time 


print("start") 
time.sleep(10) # 休眠 10 秒 


print("wake up") 


time 包 还 定义 了 struct_time 对 象 。 该 对 象 将 挂钟 时 间 转 换 为 年 、 
月 、 日 、 时 、 分 、 秒 等 ， 存 储 在 该 对 象 的 各 个 属性 中 ， 比 如 tm_year、 
tm_mon 、 tm mday...... 下 面 几 种 方法 可 以 将 挂钟 时 间 转 换 为 
struct_time 对 象 : 


st = time.gmtime() # 返 回 struct_time 格 式 的 UTC 时 间 ] 
st = time.localtime() # 返 回 struct_time 格 式 的 当地 时 间 ， 当 地 时 区 根据 系 
# 统 环境 决定 。 


我 们 也 可 以 反 过 来 ， 把 一 个 struct_time 对 象 转换 为 tme 对 象 : 


s = time.mktime(st)  # 将 struct_time 格 式 转换 成 挂钟 时 间 


2。datetime 包 


datetime 包 是 基于 time 包 的 一 个 高 级 包 ， 用 起 来 更 加 便利 。 
datetime 可 以 理解 为 由 date 和 time 两 个 部 分 组 成 。date 是 指 年 、 月 、 日 
构成 的 日 期 相当 于 日 历 。time 是 指 时 、 分 、 秒 、 毫 秒 构成 的 一 天 24 
小 时 中 的 具体 时 间 ， 提 供 了 与 手表 类 似 的 功能 。 因 此 ，datetime 模 块 下 
有 两 个 类 : datetime.date 类 和 datetime.time 类 。 你 也 可 以 把 日 历 和 手表 
合 在 一 起 使 用 ， 即 直接 调用 datetime.datetime 类 。 这 里 只 介绍 综合 性 的 
datetime.datetime 类 ， 单 独 的 datetime.date 和 datetime.time 类 与 之 类 似 。 


一 个 时 间 点 ， 比 如 2012 年 9 月 3 日 21 时 30 分 ， 我 们 可 以 用 如 下 方式 
表达 : 


import datetime 


t = datetime.datetime(2012,9,3,21,30) 


print(t) 


对 象 t 有 如 下 属性 : 


hour, minute, second, millisecond,microsecond: 小 时 、 分 、 秒 、 毫 秒 、 
微 秒 
year, month, day, weekday: 年 、 月 、 日 、 星 期 几 


借助 datetime 包 ， 我 们 还 可 以 进行 时 间 间 隔 的 运算 。 它 包含 一 个 专 
门 代 表 时 间 间 隔 对 象 的 类 ， 即 timedelta。 一 个 datetime.datetime 的 时 间 
点 加 上 一 个 时 间 间 隔 ， 就 可 以 得 到 一 个 新 的 时 间 点 。 比 如 今天 的 上 午 3 
点 加 上 5 个 小 时 ， 就 可 以 得 到 今天 的 上 午 8 点 。 同 理 ， 两 个 时 间 点 相 减 
可 以 得 到 一 个 时 间 间 隔 : 


import datetime 


t = datetime.datetime(2012,9,3,21,30) 
t_next = datetime.datetime(2012,9,5,23,30) 
deltai = datetime.timedelta(seconds = 600) 


delta2 = datetime.timedelta(weeks = 3) 


print(t + delta1) # 打印 2012-09-03 21:40:00 


print(t + delta2) # 打印 2012-09-24 21:30:00 
print(t_next - t) # 打印 2 days, 2:00:00 


在 给 datetime.timedelta 传 递 参数 时 ， 除 了 上 面 的 秒 (seconds) 和 
星期 (weeks) 外 ， 还 可 以 是 天 (days) 、 小 时 (hours) . BF 


(milliseconds) 、 微 秒 (microseconds) o 


两 个 datetime 对 象 能 进行 比较 运算 ， 以 确定 哪个 时 间 间 隔 更 长 。 比 
如 使 用 上 面 的 tf 和 t_next: 


print(t >t_next) # 打印 False 


3。 日 期 格式 


对 于 包含 有 时 间 信 息 的 字符 串 来 说 ， 我 们 可 以 借助 datetime 包 ， 把 
它 转 换 成 datetime 类 的 对 象 ， 比 如 : 


from datetime import datetime 
str = "output-1997-12-23-030000.txt" 


format = "output -%Y -%m-%d -%H%M%S . txt" 


t = datetime.strptime(str, format) 


print(t) # 打印 1997-12-23 03:00:00 


包含 有 时 间 信 息 的 字符 串 是 "output-1997-12-23-030000.txt"， 是 一 
个 文件 名 。 字 符 串 format 定 义 了 一 个 格式 。 这 个 格式 中 包含 了 几 个 由 % 
引领 的 特殊 字符 ， 用 来 代表 不 同时 间 信 息 。%Y 表 示 年 份 、%m 表 示 
月 、%d 表 示 日 、%H 表 示 24 小 时 制 的 小 时 、%M 表 示 分 、%S 表 示 秒 。 
通过 strptime 方 法 ，Python 会 把 需要 解析 的 字符 串 往 格式 上 凑 。 比 如 
说 ， 在 格式 中 %Y 的 位 置 ， 正 好 看 到 "1997"， 就 认为 1997 是 datetime 对 
象 { 的 年 。 以 此 类 推 ， 就 从 字符 串 中 获得 了 t 对 象 的 时 间 信 息 。 


反 过 来 ， 我 们 也 可 以 调用 datetime 对 象 的 strftime 方 法 ， 将 一 个 
datetime 对 象 转换 为 特定 格式 的 字符 串 ， 比 如 : 


from datetime import datetime 
format = "%Y-%m-%d %H:%M" 
t = datetime(2012,9,5, 23,30) 


print(t.strftime(format) ) # 打印 2012-09-05 23:30 


可 以 看 到 ， 格 式 化 转化 的 关键 是 % 号 引领 的 特殊 符号 。 这 些 特殊 
符号 有 很 多 种 ， 分 别 代表 不 同 的 时 间 人 信息。 常用 的 特殊 符号 还 有 : 


%A: 表示 英文 的 星期 几 ， 如 Sunday、Monday.… 
%a: 简写 的 英文 星期 几 ， 如 Sun、 Mon... 


%I: 表示 小 时 ，12 小 时 制 
%p: 上 午 或 下 午 ， 即 AM 或 PM 
%f: 表示 毫秒 ， 如 2、0014、000001 


但 如 果 想 在 格式 中 表达 % 这 个 字符 本 身 ， 而 不 是 特殊 符号 ， 那 么 
可 以 使 用 %%。 


5.3 “看 起 来 像 那样 的 东西 
1. 正则 表达 式 


正则 表达 式 (Regular Expression) 的 主要 功能 是 从 字符 串 
(string) 中 通过 特定 的 模式 ， 搜 索 希 望 找到 的 内 容 。 前 面 ， 我 们 已 经 
简单 介绍 了 字符 串 对 象 的 一 些 方法 。 我 们 可 以 通过 这 些 方 法 来 实现 简 
单 的 搜索 功能 ， 例 如 ， 从 字符 串 '"TIlove you" 中 搜索 "you" 这 一 子 字符 
串 。 但 有 些 时 候 ， 我 们 只 是 想 要 找到 符合 某 种 格式 的 字符 串 ， 而 不 是 
具体 的 "you"。 类 似 的 例子 还 有 很 多 ， 比 如 说 找到 小 说 中 的 所 有 人 名 ， 
再 比如 说 想 找 到 字符 串 中 包含 的 数字 。 幸 好 ， 这 种 格式 化 的 搜索 可 以 
写成 正则 表达 式 。Python 中 可 以 使 用 包 re 来 处 理 正 则 表达 式 。 下 面 是 
一 个 简单 的 应 用 ， 目 的 是 找到 字符 串 中 的 数字 : 


import re 
m = re.search("[0-9]","abcd4ef") 


print(m.group(0)) 


re.search0 接 收 两 个 参数 ， 第 一 个 参数 "[0-9]" 就 是 我 们 所 说 的 正则 
表达 式 ， 它 告诉 Python，“ 听 着 ， 我 想 从 字符 串 中 找 从 0 到 9 的 任意 一 个 
数字 字符 ”。 


re.search() 如 果 从 第 二 个 参数 中 找到 符合 要 求 的 子 字 符 串 ， 就 返回 
一 个 对 象 m， 你 可 以 通过 mo.group() 的 方法 查看 搜索 到 的 结果 。 如 果 没 
有 找到 符合 要 求 的 字符 ， 则 re.searchO) 会 返回 None。 


除了 search() 方 法 外 ，re 包 还 提供 了 其 他 搜索 方法 ， 它 们 的 功能 
所 差别 |: 


m = re.search(pattern, string) # 搜索 整个 字符 串 ， 直 到 发 现 符合 的 
子 字符 串 
m = re.match(pattern, string) # 从 头 开始 检查 字符 串 是 否 符合 正则 
表达 式 。 


# 必须 从 字符 串 的 第 一 个 字符 开始 就 
相符 


我 们 可 以 从 这 两 个 图 数 中 选择 一 个 进行 搜索 。 上 面 的 例子 中 ， 如 
果 使 用 re.matchO 的 话 ， 则 会 得 到 None， 因 为 字符 串 的 起 始 为 "a" ， 不 
符合 "[0-9]" 的 要 求 。 再 一 次 ， 我 们 可 以 使 用 m.group0 来 查看 找到 的 字 
符 串 。 


我 们 还 可 以 在 搜索 之 后 将 搜索 到 的 子 字 符 串 进行 替换 。 下 面 的 
subO0 利 用 正则 pattern 在 字符 串 string 中 进行 搜索 。 对 于 搜索 到 的 字符 


串 ， 用 另 一 个 字符 串 replacement 进 行 替换 。 函 数 将 返回 替换 后 的 字符 
FB: 


str = re.sub(pattern, replacement, string) 


此 外 ， 常 用 的 方法 还 有 


re.split() # 根据 正则 表达 式 分 割 字 符 串 ， 将 分 割 后 的 所 有 子 字符 串 
# 放 在 一 个 表 (1ist ) 中 返回 
re.findall() # 根据 正则 表达 式 搜索 字符 串 ， 将 所 有 符合 条 件 的 子 字符 串 


# 放 在 一 个 表 (1ist ) 中 返回 


2。. 写 一 个 正则 表达 式 


正则 表达 式 的 功能 其 实 非 党 强大 ， 关 很 在 于 如 何 写 出 有 效 的 正则 
表达 式 。 我 们 先 看 正则 表达 式 的 常用 语法 。 正 则 表达 式 用 某 些 符号 代 
表单 个 字符 : 


# 任意 的 一 个 字符 
alb # 字符 a 或 字符 b 
[afg] # a 或 者 f 或 者 g 的 一 个 字符 


[0-4] # 0-4 范 围 内 的 一 个 字符 

[a-f] # a-f 范 围 内 的 一 个 字符 

[Am] # 不 是 m 的 一 个 字符 

\s # 一 个 空 

NS # 一 个 非 空 

\d # 一 个 数字 ， 相 当 于 [0-9] 

\D # 一 个 非 数字 ， 相 当 于 [^9-9] 

\w # 数字 或 字母 ， 相 当 于 [0-9a-zA-Z] 
\W # 非 数 字 非 字母 ， 相 当 于 [^9-9a-zA-2Z] 


正则 表达 式 还 可 以 用 某 些 符号 来 表示 某 种 形式 的 重复 ， 这 些 符 号 
紧 跟 在 单个 字符 之 后 ， 就 表示 多 个 这 样 类 似 的 字符 : 


# 重复 超过 0 次 或 更 多 次 

+ # 重复 1 次 或 超过 1 次 

? # 重复 0 次 或 1 次 

{m} # 重复 m 次 。 比 如 ，a{4} 相 当 于 aaaa， 再 比如 ，[1-3]{2} 相 当 于 [1- 
3][1-3] 

{m, n} # 重复 m 到 n 次 。 比 如 说 a{2，5} 表 示 a 重 复 2 到 5 次 。 


# 小 于 m 次 的 重复 ， 或 者 大 于 n 次 的 重复 都 不 符合 条 件 


下 面 是 重复 符号 的 例子 : 


正则 表达 ”相符 的 字符 串 举 例 ”不 相符 字符 串 举例 


[0-9]{3,5} "9678" "42", "1234567" 
a?b aa oia Nab" "ch" 
a+b "aaaaab" "p"! 


最 后 ， 还 有 位 置 相关 的 符号 : 


# 字符 串 的 起 始 位 置 
$ # 字符 串 的 结尾 位 置 


下 面 是 位 置 符号 的 一 些 例子 : 


正则 表达 “相符 的 字符 串 举 例 ”不 相符 的 字符 串 


Aab. c$ abeec cabeec 


3。 进一步 提取 


有 的 时 候 ， 我 们 想 在 搜索 的 同时 ， 对 结果 进一步 提炼 。 比 如 说 ， 
我 们 从 下 面 一 个 字符 串 中 提取 信息 : 


content = "abcd_output_1994 abcd_1912 abcd" 


如 果 我 们 把 正则 表达 式 写 成 : 


"output_\d{4}" 


那么 用 search() 方 法 可 以 找到 "output_1994"。 但 如 果 我 们 想 进一步 
提取 出 1994 本 身 ， 则 可 以 在 正则 表达 式 上 给 目标 加 上 括号 : 


output_(\d{4}) 


括号 0 包围 了 一 个 小 的 正则 表达 式 \d{4}。 这 个 小 的 正则 表达 式 能 
从 结果 中 进一步 筛选 信息 ， 即 四 位 的 阿拉 伯 数 字 。 用 括号 (0) 圈 起 来 的 
正则 表达 式 的 一 部 分 ， 称 为 群 (group) 。 一 个 正则 表达 式 中 可 以 有 多 
个 群 。 


我 们 可 以 group(number) 的 方法 来 查询 群 。 需 要 注意 的 是 ， 
group(0) 是 整个 正则 表达 的 搜索 结果 。group(1) 是 第 一 个 群 ， 以 此 类 
推 : 


import re 


m = re.search("output_(\d{4})", "output_1986.txt") 


print(m.group(1)) # 将 找到 4 个 数字 组 成 的 1986 


我 们 还 可 以 将 群 命名 ， 以 便 更 好 地 使 用 group 碍 询 : 


Import re 


m = re.search("output_(?P<year>\d{4})", 


"output_1986.txt") #(?P<name>...) Agroup 
命名 
print(m.group("year")) # 打印 1986 


上 面 的 (?P<year>...) 括 住 了 一 个 群 ， 并 把 它 命名 为 year。 用 这 种 方 
式 来 产生 群 ， 就 可 以 通过 "year" 这 个 键 来 提取 结果 。 


5.4 Python MAR 
1。HTTP 通 信 简 介 


通信 是 一 件 奇妙 的 事情 。 它 让 信息 在 不 同 的 个 体 间 传 递 。 动 物 们 
散发 着 化 学 元 素 ， 传 递 着 求偶 信息 。 人 则 说 着 甜言蜜语 ， 向 情人 表达 
爱 意 。 猫 人 们 吹 着 口哨 ， 悄 悄 地 围 拢 猎物 。 服 务 生 则 大 声 地 向 后 厨 吃 
喝 ， 要 加 两 套 炸 鸡 和 啤酒 。 红 绿灯 指挥 着 交通 ， 电 视 上 播放 着 广告 ， 


法 老 的 金字 塔 刻 着 禁止 进入 的 诅 欧 。 有 了 通信 ， 每 个 人 都 和 周围 的 世 
界 和 连接。 在 通信 这 个 神秘 的 过 程 中 ， 参 与 通信 的 个 体 总 要 遵守 特定 的 
协议 (Protocol) 。 在 日 常 交 谈 中 ， 我 们 无 形 中 使 用 约定 俗 成 的 语法 。 
如 果 两 个 人 使 用 不 同 的 语法 ， 那 么 就 是 以 不 同 的 协议 来 交流 ， 最 终 会 
ARPA Zo 


计算 机 之 间 的 通信 就 是 在 不 同 的 计算 机 间 传 递 信息 。 所 以 ， 计 算 
机 通信 也 要 遵循 通信 协议 。 为 了 多 层次 地 实现 全 球 互联 网 通信 ， 计 算 
机 通信 也 有 一 套 多 层次 的 协议 体系 。HTTP 协 议 是 最 常见 的 一 种 网 络 协 
议 。 它 的 全 名 是 the Hypertext Transfer Protocol ， 即 超 文本 传输 协议 。 
HTTP 协 议 能 实现 文件 ， 特 别 是 超 文本 文件 的 传输 。 在 互联 网 时 代 ， 它 
是 应 用 最 广 的 互联 网 协议 之 一 。 事 实 上 ， 当 我 们 访问 一 个 网 址 时 ， 通 
常会 在 浏览 器 中 输入 http 打 头 的 网 址 ， 如 http:/www.example.com。 这 
里 的 http 字 样 ， 说 的 就 是 要 用 HTTP 协 议 访 问 相 应 网 站 。 


HTTP 的 工作 方式 类 似 于 快餐 点 单 : 

1) 请 求 (request) : 顾客 向 服务 员 提 出 请 求 “ 来 个 鸡腿 汉堡 ”。 
2) 回复 (response) : 服务 员 根据 情况 ， 回 应 顾客 的 请 求 。 
根据 情况 不 同 ， 服 务 员 的 回应 可 能 有 很 多 种 ， 比 如 : 


。 服务 员 准 备 鸡 腿 汉堡 ， 将 鸡腿 汉堡 交 给 顾客 。 《一切 OKI) 

。 服务 员 发 现 自己 工作 在 甜品 站 。 他 让 顾客 前 往 正 式 柜台 点 单 。 
(重新 定向 ) 

。 服务 员 告 诉 顾客 鸡腿 汉堡 没有 了 。 (无 法 找到 ) 


交易 结束 后 ， 服 务 员 就 将 刚才 的 交易 抛 到 脑 后 ， 准 备 服务 下 一 位 
顾客 。 


图 5-1 HTTP 服 务 器 


计算 机 发 出 请 求 会 遵照 下 面 的 格式 : 


GET /index.html HTTP/1.1 


Host: www.example.com 


在 起 始 行 中 ， 有 三 段 信息 : 


。 GET 方 法 。 用 于 说 明 想 要 服务 器 执行 的 操作 。 

。 /index.html 资源 的 路 径 。 这 里 指向 服务 器 上 的 index.html 文 件 。 

e HTTP/1.1 协 议 的 版 本 。HTTP 第 一 个 广泛 使 用 的 版 本 是 1.0， 当 前 
版 本 为 1.1。 


早期 的 HTTP 协 议 只 有 GET 方 法 。 遵 从 HTTP 协 议 ， 服 务 器 接收 到 
GET 请 求 后 ， 会 将 特定 资源 传送 给 客户 。 这 类 似 于 客户 点 单 ， 并 获得 
汉堡 的 过 程 。GET 方 法 之 外 ， 最 常用 的 是 POST 方法 。 它 用 于 从 客户 端 
向 服务 器 提交 数据 ， 请 求 的 后 面 会 附加 上 要 提交 的 数据 。 服 务 器 会 对 
POST 方法 提交 的 数据 进行 一 定 的 处 理 。 样 例 请 求 中 有 一 行头 信息 。 这 
个 头 信息 的 类 型 是 Host， 说 明了 想 要 访问 的 服务 器 的 地 址 。 


服务 器 在 接收 到 请 求 之 后 ， 会 根据 程序 ， 生 成 对 应 于 该 请 求 的 回 
复 ， 比 如 : 


HTTP/1.1 200 OK 
Content-type: text/plain 


Content-length: 12 


Hello World! 


回复 的 起 始 行 包含 三 段 信息 : 


e HTTP/1.1: 协议 版 本 
。200: 状态 码 (status code) 
e OK: 状态 描述 


OK 是 对 状态 码 200 的 文字 描述 ， 它 只 是 为 了 便于 人 类 的 阅读 。 电 
脑 只 关心 三 位 的 状态 码 (Status Code) ， 即 这 里 的 200。200 表 示 一 切 
OK， 资 源 正常 返回 。 状 态 码 代表 了 服务 器 回应 的 类 型 。 其 他 常见 的 状 
态 码 还 有 很 多 ， 例 如 : 


e 302， 重 新 定向 (Redirect) : 我 这 里 没有 你 想 要 的 资源 ， 但 我 知 
一 个 地 方 xxx 有 ， 你 可 以 去 那里 找 。 
。404， 无 法 找到 (Not Found) : 我 找 不 到 你 想 要 的 资源 ， 无 能 ， 
力 。 


下 一 行 Content-type 说 明了 主体 所 包含 的 资源 的 类 型 。 根 据 类 型 的 
不 同 ， 客 户 端 可 以 启动 不 同 的 处 理 程序 〈 比 如 显示 图 像 文件 、 播 放声 
音 文件 等 。 下 面 是 一 些 常 见 的 资源 : 


text/plain: 普通 文本 
text/html: HTML 文 本 
image/jpeg: jpeg 图 片 
image/gif: gif 图 片 


Content-length 说 明了 主体 部 分 的 长 度 ， 以 字 节 (byte) 为 单位 。 


剩 下 的 是 回复 的 主体 部 分 ， 包 含 了 主要 的 文本 数据 。 这 里 是 普通 
类 型 的 一 段 文本 ， 即 : 


Hello World! 


通过 一 次 HTTP 交易， 客户 端 从 服务 器 那里 获得 了 自己 请 求 的 资 
源 ， 即 这 里 的 文本 。 上 面 是 对 HTTP 协 议 工作 过 程 的 一 个 简要 介绍 ， 省 
略 了 很 多 细节 。 以 此 为 基础 ， 二 
信 的 。 


2。http.client 包 


Python 标准 库 中 的 http.client 包 可 用 于 发 出 HTTP 请 求 。 在 上 一 节 中 
我 们 已 经 看 到 ，HTTP 请 求 最 重要 的 一 些 信息 是 主机 地 址 、 请 求 方法 和 
资源 路 径 。 只 要 明确 这 些 信 息 ， 再 加 上 http.client 包 的 帮助 ， 就 可 以 发 
出 HTTP 请 求 了 。 


import http.client 


conn = http.client.HTTPConnection("www.example.com") # 主机 
地 址 


conn.request("GET", "/") 


请 求 方法 和 资源 路 径 


St chit 
40 
器 
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response = conn.getresponse() 


print(response.status, response.reason)# 回复 的 状态 码 和 状态 描述 


content = response.read() # 回复 的 主体 内 容 


print(content) 


如 果 网 络 正常 ， 那 么 上 面 的 程序 将 访问 网 址 ， 并 获得 对 应 位 置 的 
超 文 本 文件 。 在 浏览 器 中 ， 这 个 超 文本 文件 显示 为 图 5-2 所 示 内 容 。 


Example Domain 


This domain is established to be used for illustrative examples in documents. You 
may use this domain in examples without prior coordination or asking for 


permission， 


More information... 


图 5-2” 超 文本 文件 显示 的 内 容 


5.5” 写 一 个 爬虫 


有 了 前 面 四 个 小 节 的 准备 ， 我 们 可 以 用 Python 来 写 一 个 相对 复杂 
的 程序 了 ， 即 一 个 网 络 肘 虫 。 这 上 段 程序 能 自动 浏览 网 页 ， 并 从 网 页 上 
抓 取 我 们 想 要 的 信息 。 网 络 爬 虫 应 用 很 广 ， 很 多 搜索 引 敬 都 是 用 爬虫 
抓 取 并 分 析 网 页 信息 ， 从 而 让 不 同 的 网 页 对 应 不 同 的 搜索 关键 字 。 许 
多 研究 互联 网 行为 的 学 者 也 会 用 爬虫 抓 取 网 络 信息 ， 用 来 进一步 分 析 
人 们 使 用 互联 网 的 行为 。 还 有 一 些 下 载 网 络 视 频 或 图 片 的 软件 ， 也 是 
基于 爬虫 来 完成 主要 工作 的 。 很 多 时 候 ， 爬 虫 可 以 非常 复杂 ， 运 行 起 


来 也 相当 耗 时 。 这 里 ， 我 们 想 用 拒 虫 做 一 件 简单 的 事 ， 即 让 它 访问 笔 
者 的 博客 首页 ， 提 取出 最 近 文章 的 发 表 日 期 和 阅读 量 。 


第 一 步 当 然 是 访问 博客 首页 ， 获 得 首页 的 内 容 。 根 据 5.4 节 的 内 
容 ， 这 非常 简单 。 笔 者 的 博客 的 地 址 是 www.cnblogs.com/vamei， 主 机 
地 址 是 www.cnblogs.com， 资 源 位 置 是 wamei。 这 个 页 面 是 一 个 超 文本 
文件 ， 所 以 我 们 用 HTTP 协 议 访问 : 


import http.client 


conn = http.client.HTTPConnection("www.cnblogs.com") # 主机 
地 址 

conn.request("GET", "/vamei") # 请 求 方法 和 资源 路 径 
response = conn.getresponse() # 获得 回复 

content = response.read() # 回复 的 主体 内 容 
content = content.split("\r\n") # 分 割 成 行 


这 里 的 content 是 列表 ， 列 表 的 每 个 元 素 是 超 文 本 的 一 行 。 对 于 我 
们 所 关心 的 信息 来 说 ， 它 们 存在 的 行 看 起 来 是 下 面 的 样子 : 


<div class="postDesc">posted @ 2014-08-12 20:55 Vamei 阅读 (6221) 
评 论 (11) <a href ="http://i.cnblogs.com/EditPosts.aspx? 


postid=3905833" rel="nofollow">4@48</a></div> 


我 们 想 要 的 信息 ， 如 2014-08-12 20:55, URHE 6221 RRE — 
串 文 字 中 。 要 想 提 取出 类 似 这 样 的 信息 ， 我 们 很 自然 地 想到 了 5.3 节 的 
正则 表达 式 : 


Import re 


pattern = "posted @ (\d{4}-[0-1]\d-{0-3}\d [0-2]\d:[0-6]\d) 
Vamei 阅读 \((\d+)\) 评论 " 
for line in content: 

m = re.search(pattern, line) 

if m != None: 


print(m.group(1), m.group(2)) 


把 两 段 程 序 合 在 一 起 ， 将 打印 出 如 下 结果 : 


2016-03-23 14:08 9622 
2016-03-23 07:12 1787 
2016-03-22 11:20 1161 
2015-05-11 13:08 5864 
2014-10-01 12:50 5584 
2014-09-01 05:41 9073 
2014-08-20 10:48 6971 
2014-08-16 11:51 5682 


2014-08-13 22:43 7119 


2014-08-12 20:55 6221 


根据 本 章 的 内 容 ， 你 还 可 以 把 日 期 转换 成 日 期 对 象 ， 进 行 更 复杂 
的 操作 ， 如 查询 文章 是 星期 几 发 表 的 。 你 还 可 以 把 上 面 的 内 容 写 入 文 
件 ， 长 久 的 保存 起 来 。 可 以 看 到 ， 这 个 简单 的 程序 中 包含 了 不 同方 面 
的 知识 内 容 。 编 程 的 乐趣 就 在 于 此 ， 通 过 对 基本 知识 的 组 合 ， 创 造 出 
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6.4 ”内存 管理 


在 本 章 的 前 半 部 分 ， 我 们 将 一 起 探索 Python“ 一 切 缘 对 象 " 背 后 的 
含义 。 许 多 语法 ， 如 运算 符 、 元 素 引 用 、 内 置 遂 数 中 ， 其 实 都 来 自 于 
一 些 特殊 的 对 象 。 这 样 的 设计 既 满足 了 Python 多 范式 的 需求 ， 又 能 以 
简单 的 体系 满足 丰富 的 语法 需求 ， 如 运算 符 重 载 与 即时 特性 等 。 而 在 
本 章 后 半 部 分 ， 我 们 将 深入 到 对 象 相关 的 重要 机 制 ， 如 动态 类 型 和 垃 
圾 回收 。 对 这 部 分 内 容 的 学 习 ， 将 让 我 们 对 Python 的 理解 更 上 一 个 台 


阶 。 


6.1 ”一切 皆 对 象 
1。 运 算 符 

我 们 知道 ，list 是 列表 的 类 。 如 果 用 dir(list) 调 查 list 的 属性 ， 能 看 到 
一 个 属性 是 _add”()。 从 样式 上 看 ， add 0 是 特殊 方法 。 它 特殊 在 


哪 呢 ?这 个 方法 定义 了 “+” 运 算 符 对 于 list 对 象 的 意义 ， 两 个 list 的 对 象 
相 加 时 ， 会 进行 合并 列表 的 操作 。 结 果 为 合并 在 一 起 的 一 个 列表 : 


>>>print([1,2,3] + [5,6,9]) # 得 到 [1, 2, 3, 5, 6, 9] 


运算 符 ， 比 如 +、-、>、<、and、or 等 ， 都 是 通过 特殊 方法 实现 
的 ， 比 如 : 


"abc" + "xyz" # 连接 字符 串 ， 获得 "abcxyz" 


实际 执行 了 如 下 操作 : 


"abc". add_ ("xyz") 


两 个 对 象 是 否 能 进行 加 法 运算 ， 首 先 就 要 看 相应 的 对 象 是 否 
_ add (方法 。 一 旦 相应 的 对 象 有 ”add (0 方法， 即便 这 个 对 象 从 数 
学 上 不 可 加 ， 我 们 也 可 以 执行 加 法 操作 。 而 相对 于 特殊 方法 ， 功 能 相 
同 的 运算 符 更 加 简洁 ， 能 够 简化 书写 。 下 面 的 一 些 运算 用 特殊 方法 来 
SAB EMM 


尝试 下 面 的 操作 ， 看 看 效果 ， 再 想 想 它 对 应 的 运算 符 : 


>>>(1.8).__mul__(2.0) # 1.82.0 


>>>True.__or__(False) # True or False 


这 些 运算 相关 的 特殊 方法 还 能 改变 执行 运算 的 方式 。 比 如 ， 列 表 
在 Python 中 是 不 可 以 相 减 的 。 你 可 以 测试 下 面 的 操作 : 


>>>[1, 2, 3] J [3,4] 


会 有 错误 信息 ， 说 明 列 表 对 象 不 能 进行 减法 操作 ， 即 列表 没有 定 
义 “-" 运 算 符 。 我 们 可 以 创建 一 个 列表 的 子 类 ， 通 过 增加 _sub_“() 方 
法 ， 来 添加 减法 操作 的 定义 ， 例 如 : 


Class SuperList(list): 
def _ sub (self, b): 
a = self[:] ”# 由 于 继承 于 list，self 可 以 利用 [:] 的 引用 来 表示 整 
个 列表 
b = b[:] 
while len(b) > 0: 
element_b = b.pop() 
if element_b in a: 
a.remove(element_b) 
return a 


print(SuperList([1,2,3]) - SuperList([3,4])) # 打印 [1，2] 


上 面 的 例子 中 ， 内 置 亢 数 len0 用 来 返回 列表 所 包含 的 元 素 的 总 
Xo AAA sub_ 0 定义 了 “-” 的 操作 : 从 第 一 个 表 中 去 掉 第 二 个 表 
中 出 现 的 元 素 。 于 是 ， 我 们 创建 的 两 个 SuperList 对 象 ， 融 可 以 执行 减 
法 操作 了 。 即 使 _sub_ 0 方法 已 经 在 父 类 中 定义 过 ， 但 在 子 类 中 重新 
定义 后 ， 子 类 中 的 方法 会 覆盖 父 类 的 同名 方法 。 即 运算 符 将 被 重新 定 
义 。 


定义 运算 符 对 于 复杂 的 对 象 非常 有 用 。 例 如 ， 人 类 有 多 个 属性 ， 
比如 姓名 、 年 龄 和 身高 。 我 们 可 以 把 人 类 的 比较 (>、<、=) 定义 成 


只 看 年 龄 。 这 样 就 可 以 根据 自己 的 目的 ， 将 原本 不 存在 的 运算 增加 在 
对 象 上 了 。 如 果 你 参加 过 军训 ， 那 么 很 可 能 玩 过 一 个 “向 左 转向 右 转 ” 
的 游戏 。 当 教官 喊 口令 时 ， 你 必须 要 采取 相反 的 动作 。 比 如 说 听 到 “向 
左 转 ”， 就 要 执行 向 右 转 的 动作 。 这 个 游戏 中 实际 上 就 重新 定义 了 "向 
左 转 2” 和 “向 右 转 ” 的 运算 符 。 


2。 元素 引用 


下 面 是 我 们 常见 的 表 元 素 引 用 方式 : 


li = [1, 2, 3, 4, 5, 6] 
print(1i[3]) # 打印 4 


上 面 的 程序 运行 到 li[3] 的 时 候 ，Python 发 现 并 理解 0] 符号， 然后 调 
用 _getitem_ (方法 。 


li = [1, 2, 3, 4, 5, 6] 
print(li.__getitem__(3)) # 打印 4 


看 下 面 的 操作 ， 想 想 它 的 对 应 : 


li = [1, 2, 3, 4, 5, 6] 


li.__setitem__(3, 0) 


print(1i) # RE[1, 2, 3, 0, 5, 6] 


example dict = {"a":1, "b":2} 
example dict. delitem ("a") 


print(example_dict) # 返回 {"b":2} 


3. AZAKI 


与 运算 符 类 似 ， 许 多 内 置 图 数 也 都 是 调用 对 象 的 特殊 方法 。 比 
如 : 


len([1,2,3]) # 返回 表 中 元 素 的 总 数 


实际 上 做 的 是 : 


[1,2,3]. len () 


相对 于 _len_(0， 内 置 水 数 len0 也 起 到 了 简化 书写 的 作用 。 


党 试 下 面 的 操作 ， 想 一 下 它 的 对 应 内 置 函 数 : 


(-1).__abs__() 
(2.3). int_ () 


6.2 ”属性 管理 
1。 属 性 覆盖 的 背后 


我 们 在 继承 中 ， 提 到 了 Python 中 属性 覆盖 的 机 制 。 为 了 深入 理解 
属性 覆盖 ， 我 们 有 必要 理解 python 的 _ dict 属性 。 当 我 们 调用 对 象 的 
属性 时 ， 这 个 属性 可 能 有 很 多 来 源 。 除 了 来 自 对 象 属性 和 类 属性 ， 这 
个 属性 还 可 能 是 从 祖先 类 那里 继承 来 的 。 一 个 类 或 对 象 拥有 的 属性 ， 
会 记录 在 _、dict_ 中 。 这 个 _dict_ 是 一 个 词典 ， 键 为 属性 名 ， 对 应 的 
值 为 某 个 属性 。Python 在 寻找 对 象 的 属性 时 ， 会 按照 继承 关系 依次 寻 
找 dict 。 


我 们 看 下 面 的 类 和 对 象 ，Chicken 类 继承 自 Bird 类 ， 而 summer 为 
Chicken 类 的 一 个 对 象 : 


Class Bird(object): 


feather = True 


def chirp(self): 


print("some sound") 


class Chicken(Bird): 


fly = False 


def _ init__(self, age): 


self.age = age 


def chirp(self): 
print("ji") 

summer = Chicken(2) 
print("===> summer") 


print(summer. dict__) 


print( "===> Chicken") 


print(Chicken.__dict__) 


print( "===> Bird") 


print(Bird.__dict__) 


print("===> object") 


print(object._dict__) 


下 面 是 我 们 的 输出 结果 : 


===> Summer 


{'age': 2} 

===> Chicken 

{'fly': False, ‘chirp': <function chirp at  0x10c550410>, 
'__module__': ' main_', ' doc_': None, ' init _': 


<function __init _ at 0x10c550398>} 


===>Bird 

{'__module__': ' main_—', 'chirp': <function chirp at 
0x10c550320>, ' dict__': <attribute '_ dict ' of 'Bird' 
objects>, 'feather': True, '__weakref__': <attribute 
'__weakref__' of 'Bird' objects>, '_ doc ': None} 

===>object 

{ setattr__': <slot wrapper ' setattr_' of ‘object' 
objects>, '__reduce ex ': <method '_reduce_ex__' of '‘'object' 
objects>, '_ new__': <built-in method _ new _ of type object at 
0x10c14fa80>, '  reduce__': <method '_reduce__' of 'object' 
objects>, ' str__': <slot wrapper '_ str ' of ‘'‘object' 
objects>, '_ format__': <method '_ format ' of ‘'‘object' 
objects>, ' getattribute__': <slot wrapper '__getattribute__' 
of ‘object' objects>, ' class ': <attribute '_ class ' of 
‘object' objects>, '_delattr__': <slot wrapper '_ delattr__' 
of ‘object' objects>, ' subclasshook__': <method 
' _ subclasshook__' of '‘object' objects>, '‘'__repr__': <slot 
wrapper ‘'__repr__' of '‘object' objects>, '_ hash ': <slot 
wrapper '_ hash ' of ‘object' objects>, '_sizeof__': <method 


__sizeof__' of ‘'object' objects>, '_ doc ': 'The most base 


type', '_ init__': <slot wrapper '‘'_init__' of ‘'‘object' 


objects>} 


这 个 顺序 是 按照 与 summer 对 象 的 亲近 关系 排列 的 。 第 一 部 分 为 
summer 对 象 自 身 的 属性 ， 也 就 是 age。 第 二 部 分 为 chicken 类 的 属性 ， 
比如 fly 和 init_ 0 方法 。 第 三 部 分 为 Bird 类 的 属性 ， 比 如 feather。 最 
后 一 部 分 属于 object 类 ， 有 诸如 _doc CANBY. 


如 果 我 们 用 内 置 疯 数 dir 来 查看 对 象 summer 的 属性 的 话 ， 可 以 看 到 
summer 对 象 包含 了 全 部 四 个 部 分 。 也 就 是 说 ， 对 象 的 属性 是 分 层 管理 
的 。 对 象 summer 能 接触 到 的 所 有 属性 ， 分 别 存 在 
summer/Chicken/Bird/object 这 四 层 。 当 我 们 需要 调用 某 个 属性 的 时 
候 ，Python 会 一 层 层 向 下 遍历 ， 直 到 找到 那个 属性 。 由 于 对 象 不 需要 
重复 存储 其 祖先 类 的 属性 ， 所 以 分 层 管 理 的 机 制 可 以 节省 存储 空间 。 


某 个 属性 可 能 在 不 同 层 被 重复 定义 。Python 在 向 下 遍历 的 过 程 
中 ， 会 选取 先 遇 到 的 那 一 个 。 这 正 是 属性 履 盖 的 原理 所 在 。 在 上 面 的 
输出 中 ， 我 们 能 看 到 ，Chicken 和 Bird 都 有 chirp() 方 法 。 如 果 从 summer 
调用 chirp(O) 方 法 ， 那 么 使 用 的 将 是 和 对 象 Summer 关 系 更 近 的 Chicken 的 
版 本 : 


summer .chirp() # 打 印 : 'ji' 


子 类 的 属性 比 父 类 的 同名 属性 有 优先 权 ， 这 正 是 属性 覆盖 的 关 
键 。 


值得 注意 的 是 ， 上 面 都 是 调用 属性 的 操作 。 如 果 进 行 赋值 ， 那 么 
Python 就 不 会 分 层 深 入 查找 了 。 下 面 创建 一 个 新 的 Chicken 类 的 对 象 
autumn， 并 通过 autumn 修 改 feather 这 一 类 属性 : 


autumn = Chicken(3) 
autumn.feather = False 


print(summer. feather ) # #JElTrue 


尽管 autumn 修 改 了 feather 属 性 值 ， 但 它 并 没有 影响 到 Bird 的 类 属 
性 。 当 我 们 使 用 下 面 的 方法 查看 autumn 的 对 象 属性 时 ， 会 发 现 新 建 了 
一 个 名 为 feather 的 对 象 属性 。 


Print(autumn, dict ) # 结果 : {"age": 3, "feather": 
False} 


因此 ，Python 在 为 属性 赋值 时 ， 只 会 搜索 对 象 本 身 的 _dict_。 如 
果 找 不 到 对 应 属性 ， 则 将 在 _dict_ 中 增加 。 在 类 定义 的 方法 中 ， 如 果 
用 self 引 用 对 象 ， 则 也 会 遵守 相同 的 规则 。 


我 们 可 以 不 依赖 继承 关系 ， 直 接 去 操作 某 个 祖先 类 的 属性 ， 比 
如 : 


Bird.feather = 3 


其 等 效 于 修改 Bird 的 _dict : 


Bird.  dict__["feather"] = 3 


2。 特 性 


同一 个 对 象 的 不 同属 性 之 间 可 能 存在 依赖 天 系 。 当 某 个 属性 被 修 
改 时 ， 我 们 希望 依赖 于 该 属性 的 其 他 属性 也 同时 变化 。 这 时 ， 我 们 不 
能 通过 ”dict_ 的 静态 词典 方式 来 储存 属性 。Python 提 供 了 多 种 即时 生 
成 属性 的 方法 。 其 中 一 种 称 为 特性 (property) 。 特 性 是 特殊 的 属性 。 
比如 我 们 为 Chicken 类 增加 一 个 表示 成 年 与 否 的 特性 adult。 当 对 象 的 年 
WS (age) 超过 1 时 ，adult 为 真 ， 否 则 为 假 : 


class Bird(object): 


feather = True 


class Chicken(Bird): 
fly = False 
def _ init__(self, age): 


self.age = age 


def get_adult(self): 


if self.age > 1.0: 
return True 
else: 
return False 


adult = property(get_adult ) # property is built-in 


summer = Chicken(2) 


print(summer.adult ) # 返回 True 


summer.age = 0.5 


print(summer.adult) # 返回 False 


AS VE (2 BA AA 2X property) KOZ. property)ax4 PJ LAM 
参数 。 前 三 个 参数 为 图 数 ， 分 别 用 于 设置 获取 、 修 改 和 删除 特性 时 ， 
Python 应 该 执行 的 操作 。 最 后 一 个 参数 为 特性 的 文档 ， 可 以 为 一 个 字 
符 串 ， 起 说 明 作 用 。 


下 面 我 们 用 一 个 例子 来 进一步 说 明 : 


class num(object): 
def _ init__(self, value): 


self.value = value 


def get_neg(self): 


return -self.value 


def set_neg(self, value): 


self.value = -value 


def del_neg(self): 


print("value also deleted") 


del self.value 


neg = property(get_neg, set_neg, del_neg, "I'm negative") 


x = num(1.1) 


print(x.neg) # 打印 -1.1 

x.neg = -22 

print(x.value) # 打印 22 
print(num.neg.__doc__) # 打印 "I'm negative" 

del x.neg # 打印 "value also deleted" 


上 面 的 num 为 一 个 数字 ， 而 neg 为 一 个 特性 ， 用 来 表示 数字 的 负 
数 。 当 一 个 数字 确定 的 时 候 ， 它 的 负数 总 是 确定 的 。 而 当 我 们 修改 一 
个 数 的 负数 时 ， 它 本 身 的 值 也 应 该 变化 。 这 两 点 由 get_neg() 和 
set_neg() 来 实现 。 而 del_neg0) 表 示 的 是 ， 如 果 删 除 特性 neg， 那 么 应 该 
执行 的 操作 是 删除 属性 value 。 property0 的 最 后 一 个 参数 ("I'm 
negative") 为 特性 neg 的 说 明文 档 。 


3. _ getattr_ (AK 


PRA Se eXpropertyYh, FAS MAA getattr_ (self, name) 来 查 
询 即 时 生成 的 属性 。 当 我 们 调用 对 象 的 一 个 属性 时 ， 如 果 通 过 _dict _ 
机 制 无 法 找到 该 属性 ， 那 么 Python 就 会 调用 对 象 的 __getattr_() 方 法 ， 
来 即时 生成 该 属性 ， 比 如 : 


class Bird(object): 


feather = True 


class chicken(Bird): 


fly = False 


def _ init__(self, age): 


self.age = age 


def _ getattr__(self, name): 
if name == "adult": 
if self.age > 1.0: 
return True 
else: 
return False 
else: 


raise AttributeError(name) 


summer = Chicken(2) 


print (summer. adult ) # #JElTrue 


summer .age = 0.5 
print(summer .adult) # 打印 False 


print(summer.male) # 抛 出 AttributeError 异 常 


每 个 特性 都 需要 有 自己 的 处 理 亢 数 ， 而 __getattr_(0 可 以 将 所 有 的 
即时 生成 属性 放 在 同一 个 函数 中 处 理 。__ getattr_(0) 可 以 根据 函数 名 区 
别处 理 不 同 的 属性 。 比 如 ， 上 面 我 们 查询 属性 名 male 的 时 候 ， 抛 出 
AttributeError 类 的 错误 。 需 要 注意 的 是 ，_getattr_(0 只 能 用 于 查询 不 


在 _dict 系统 中 的 属性 中。 


__setattr__(self, name, value) 和 delattr _ (self, name) 可 用 于 修改 和 
删除 属性 。 它 们 的 应 用 面 更 广 ， 可 用 于 任意 属性 。 


即时 生成 属性 是 非常 值得 了 解 的 概念 。 在 Python 开 发 中 ， 你 有 可 
能 使 用 这 种 方法 来 更 合理 地 管理 对 象 的 属性 。 即 时 生成 属性 还 有 其 他 
的 方式 ， 比 如 使 用 descriptor 类 。 有 兴趣 的 读者 可 以 进一步 查阅 。 


63 ”我 是 风 儿 ， 我 是 阔 
1。 动态 类 型 


动态 类 型 (Dynamic Typing) 是 Python 的 另 一 个 重要 核心 概念 。 
前 面 说 过 ，Python 的 变量 不 需要 声明 。 在 赋值 时 ， 变 量 可 以 重新 赋值 
为 其 他 任意 值 。Python 变 量 这 种 一 会 儿 变 风 一 会 儿 变 阔 的 能 力 ， 就 是 
动态 类 型 的 体现 。 我 们 从 最 简单 的 赋值 语句 入 手 : 


在 Python 中 ， 整 数 1 是 一 个 对 象 。 对 象 的 名 字 是 "a"。 但 更 精确 地 
说 ， 对 象 名 其 实 是 指向 对 象 的 一 个 引用 。 对 象 是 存储 在 内 存 中 的 实 
体 。 但 我 们 并 不 能 直接 接触 到 该 对 象 。 对 象 名 是 指向 这 一 对 象 的 引用 
(reference) 。 借 着 引用 操作 对 象 ， 就 像 是 用 筷子 夹 起 热 锅 里 的 牛 
肉 。 对 象 是 牛肉 ， 对 象 名 就 是 那 双 好 用 的 筷子 。 


通过 内 置 函 数 id0 ， 我 们 能 查看 到 引用 指向 的 是 哪个 对 象 。 这 个 函 
效能 返回 对 象 的 编号 : 


a=1 
print(id(1) ) 
print(id(a) ) 


可 以 看 到 ， 赋 值 之 后 ， 对 象 1 和 引用 a 返 回 的 编号 相同 。 


在 Python 中 ， 赋 值 其实 就 是 用 对 象 名 这 个 簧 子 去 夹 其 他 的 食物 。 
每 次 赋值 时 ， 我 们 让 左 侧 的 引用 指向 右 侧 的 对 象 。 引 用 能 随时 指向 一 
个 新 的 对 象 : 


a= 3 


print(id(a) ) 


a = Nat" 


print(id(a) ) 


第 一 个 语句 中 ，3 是 储存 在 内 存 中 的 一 个 整数 对 象 。 通 过 赋值 ， 引 
用 a 指 向 对 象 3。 第 二 个 语句 中 ， 内 存 中 建立 对 象 "at"， 是 一 个 字符 串 。 
引用 a 指 向 了 "at"。 通 过 两 次 的 id0 返 回 ， 我 们 能 发 现 ， 引 用 指向 的 对 象 
发 生 了 变化 。 既 然 变 量 名 是 个 随时 可 以 变更 指向 的 引用 ， 那 么 它 的 类 
型 自然 可 以 在 程序 中 动态 变化 。 因 此 ，Python 是 一 门 动 态 类 型 的 语 


oO 


Dll 


一 个 类 可 以 有 多 个 相等 的 对 象 。 比 如 两 个 长 字符 串 可 以 是 不 同 的 
对 象 ， 但 它们 的 值 可 以 相等 。 


除了 直接 打印 id 外 ， 我 们 还 可 以 用 is 运算 来 判断 两 个 引用 是 否 指 向 
同一 个 对 象 。 但 对 于 小 的 整数 和 短 字 符 串 来 说 ，Python 会 缓存 这 些 对 
象 ， 而 不 是 频繁 地 建立 和 销毁 它们 。 因 此 ， 下 面 的 两 个 引用 指向 同一 
TERR 


a=3 
b=3 
print(a is b) # #JElTrue 


2。 可 变 与 不 可 变 对 象 


一 个 对 象 可 以 有 多 个 5 引用， 看 下 面 一 个 例子 : 


a=5 


print(id(a) ) 


b=a 
print(id(a) ) 
print(id(b) ) 


a=at2 

print(id(a) ) 
print(id(7)) 
print(id(b)) 


通过 前 两 个 语句 ， 我 们 让 a、Pb 指 向 同一 个 整数 对 象 5。 其 中 ，b = a 
的 含义 是 让 引用 b 指 向 引用 a 所 指 的 那 一 个 对 象 。 我 们 接 下 来 对 对 象 进 
行 操作 ， 让 a 增加 2， 再 赋值 给 a。 可 以 看 到 ，a 指 向 了 整数 对 象 7， 而 b 
依然 指向 对 象 5。 本 质 上 ， 加 法 操作 并 没有 改变 对 象 5。 相 反 ，Python 
只 是 让 a 指 向 加 法 的 结果 一 另 一 个 对 象 7。 这 就 好 像 把 老人 变 成 少女 的 
魔术 ， 其 实 老 人 和 少女 都 没有 变化 。 只 不 过 是 让 少女 站 在 老人 的 舞台 
上 。 在 这 里 ， 变 的 只 是 引用 的 指向 。 改 变 一 个 引用 ， 并 不 会 影响 其 他 
引用 的 指向 。 从 效果 上 看 ， 就 是 各 个 引用 各 自 独立 ， 互 不 影响 。 


但 注意 以 下 情况 : 


List = /让 二 党 | 


listi = list2 
listi[0] = 10 


print(list2) 


在 我 们 改变 list1 时 ，list2 的 内 容 发 生 了 改变 。 引 用 之 间 似 乎 失去 了 
独立 性 。 其 实 这 并 不 矛盾 。 因 为 list1、list2 的 指向 没有 发 生变 化 ， 依 然 
是 同一 个 列表 。 但 列表 是 一 个 包含 了 多 个 引用 的 集合 。 每 个 元 素 是 一 
个 引用 ， 比 如 list1[0]、1list1[1] 等 。 每 个 引用 又 指向 一 个 对 象 ， 比 如 1、 
2、3 。 而 list1[0] = 10 这 一 赋值 操作 ， 并 不 是 改变 list1 的 指向 ， 而 是 对 
list1[0]。 也 就 是 说 ， 列 表 对 象 的 一 部 分 ， 即 一 个 元 素 的 指向 发 生 了 变 
化 。 因 此 ， 所 有 指向 该 列表 对 象 的 引用 都 受到 影响 。 


因此 ， 在 操作 列表 时 ， 如 果 通 过 元 素 引 用 改变 了 某 个 元 素 ， 那 么 
列表 对 象 自身 会 发 生 改 变 (in-place change) 。 列 表 这 种 自身 能 发 生 改 
变 的 对 象 ， 称 为 可 变 对 象 (Mutable Object) 。 我 们 之 前 见 过 的 词典 也 
是 可 变数 据 对 象 。 但 之 前 的 整数 、 浮 点 数 和 字符 串 ， 则 不 能 改变 对 象 
本 身 。 赋 值 最 多 只 能 改变 引用 的 指向 。 这 种 对 象 称 为 不 可 变 对 象 

(Immutable Object) 。 元 组 包含 多 个 元 素 ， 但 这 些 元 素 完全 不 可 以 进 
行 赋值 ， 所 以 也 是 不 可 变数 据 对 象 。 


3。 从 动态 类 型 看 阅 数 的 参数 传递 


遂 数 的 参数 传递 ， 本 质 上 传递 的 是 引用 ， 比 如 : 


def f(x): 
print(id(x) ) 
x = 100 


print(id(x) ) 


a= 1 


print(id(a)) 


f(a) 
print(a) # 通过 打印 出 的 第 二 行 ， 可 以 看 到 id 发 生 了 变化 


参数 x 是 一 个 新 的 引用 。 当 我 们 调用 遂 数 f 时 ，a 作 为 数据 传递 给 也 
数 ， 因 此 x 会 指向 a 所 指 的 对 象 ， 也 就 是 进行 一 次 赋值 操作 。 如 果 a 是 不 
可 变 对 象 ， 那 么 引用 a 和 x 之 间 相 互 独立 ， 即 对 参数 x 的 操作 不 会 影响 引 
Hao 


如 果 传 递 的 是 可 变 对 象 ， 那 么 情况 就 发 生 了 变化 : 


def f(x): 
x[0] = 100 
print(x) 


a = [1,2,3] 


f(a) 
print(a) # 打印 [100，2，3] 


上 面 的 永 数 中 ，a 指 向 一 个 可 变 的 列表 。 在 函数 调用 时 ，a 把 据 向 
传 给 了 参数 x。 这 时 ，a 和 x 两 个 引用 都 指向 了 同一 个 可 变 的 列表 。 根 据 
前 文 介绍 我 们 知道 ， 通 过 一 个 引用 操作 可 变 对 象 ， 会 影响 到 其 他 的 引 
用 。 程 序 运 行 的 结果 同样 说 明了 这 一 点 。 打 印 a 时 ， 结 果 变 成 了 
[100,2,3]。 即 冰 数 内 部 对 列表 的 操作 ， 会 被 外 部 的 引用 a“ 看 到 ”"。 编 程 
的 时 候 要 对 此 问题 留心 。 


6.4 ”内 存 管理 
1。 引用 管理 


语言 的 内 存 管 理 是 语言 设计 的 一 个 重要 方面 ， 它 是 决定 语言 性 能 
的 重要 因素 。 无 论 是 C 语 言 的 手工 管理 ， 还 是 Java 的 垃圾 回收 ， 都 成 为 
语言 最 重要 的 特征 。 这 里 以 Python 语言 为 例 ， 来 说 明 一 门 动态 类 型 
的 、 面 向 对 象 的 语言 的 内 存 管理 方式 。 


首先 我 们 要 明确 ， 对 象 内 人 存 管理 是 基于 对 引用 的 管理 。 我 们 已 经 
提 到 ， 在 Python 中 ，5 引 用 与 对 象 分 离 。 一 个 对 象 可 以 有 多 个 引用 ， 而 
每 个 对 象 中 都 存 有 指向 该 对 象 的 引用 总 数 ， 即 引用 计数 (Reference 
Count) 。 我 们 可 以 使 用 标准 库 中 sys 包 中 的 getrefcount() ， 来 查看 某 个 
对 象 的 引用 计数 。 需 要 注意 的 是 ， 当 使 用 某 个 引用 作为 参数 ， 传 递 给 


getrefcountO 时 ， 参 数 实际 上 是 创建 了 一 个 临时 的 引用 。 因 此 ， 
getrefcount() 所 得 到 的 结果 ， 会 比 期 望 的 多 1: 


from sys import getrefcount 


-El 2.3] 


print(getrefcount(a) ) 


b = a 


print(getrefcount(b) ) 


由 于 上 述 原因 ， 两 个 getrefcountO 将 返回 2 和 3， 而 不 是 期 望 的 1 和 
2o 


2. 对 象 引 用 对 象 


我 们 之 前 提 到 了 一 些 可 变 对 象 ， 如 列表 和 词典 。 它 们 都 是 数据 容 
器 对 象 ， 可 以 包含 多 个 对 象 。 实 际 上 ， 容 器 对 象 中 包含 的 并 不 是 元 素 
对 象 本 身 ， 而 是 指向 各 个 元 素 对 象 的 引用 。 我 们 也 可 以 自 定 义 一 个 对 
象 ， 并 5| 用 其 他 对 象 : 


class from_obj(object): 


def _ init__(self, to_obj): 


self.to_obj = to_obj 


b = [1,2,3] 

a = from_obj(b) 
print(id(a.to_obj) ) 
print(id(b)) 


可 以 看 到 ，a5 引 用 了 对 象 b。 对 象 引 用 对 象 ， 在 Python 中 十 分 常 
见 。 比 如 在 主 程序 使 用 a = 1， 会 把 引用 关系 存 入 到 一 个 词典 中 。 该 词 
典 对 象 用 于 记录 所 有 的 全 局 引用 。 赋 值 a=1， 实 际 上 是 让 词典 中 一 个 键 
值 为 "a" 的 元 素 引 用 整数 对 象 1。 我 们 可 以 通过 内 置 亢 数 globals0) 来 查看 
该 词典 。 


当 一 个 对 象 a 被 另 一 个 对 象 b5 引 用 时 ，a 的 引用 计 效 将 增加 1: 


from sys import getrefcount 


a= [1, 2, 3] 


print(getrefcount(a) ) 


b = [a, a] 


print(getrefcount(a) ) 


由 于 对 象 b5| 用 了 两 次 a， 因 此 a 的 引用 计数 增加 了 2。 


容器 对 象 的 引用 可 能 会 构成 很 复杂 的 拓扑 结构 ， 如 图 6-1 所 示 。 我 
们 可 以 用 objgraph 包 (来 绘制 其 引用 关系 ， 比 如 : 


x = [1, 2, 3] 


y = [x, dict(key1=x) ] 


N 
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[y, (x, y)] 


import objgraph 
objgraph.show_refs([z], filename="ref_topo.png") # 第 二 个 参数 说 明 
了 绘图 文件 的 文件 名 


图 6-1 引用 结构 


两 个 对 象 可 能 相互 引用 ， 从 而 构成 所 谓 的 引用 环 (Reference 
Cycle) 。 


a = [] 
b = [a] 
a.append(b) 


即便 是 单个 对 象 ， 只 需 目 己 5 引 用 目 己 ， 也 能 构成 引用 环 。 


a= [] 
a.append(a) 


print(getrefcount(a) ) 
引用 环 会 给 垃圾 回收 机 制 带 来 很 大 的 麻烦 ， 我 们 将 在 后 面 详 细作 
述 这 一 点 。 


某 个 对 象 的 引用 计数 可 能 减少 。 比 如 ， 可 以 使 用 del 关 键 字 删除 某 
个 引用 : 


from sys import getrefcount 


print(getrefcount(b)) 
del a 


print(getrefcount(b)) 


我 们 前 面 提 到 过 ，del 也 可 以 用 于 删除 容器 中 的 元 素 ， 比 如 : 


ai[1 223] 
del a[0] 


print(a) 


如 果 某 个 引用 指向 对 象 a， 那 么 当 这 个 引用 被 重新 定向 到 某 个 其 他 
对 象 b 时 ， 对 象 的 引用 计数 将 减少 : 


from sys import getrefcount 


a = [1, 2, 3] 

b=a 
print(getrefcount(b)) 
a=1 


print(getrefcount(b) ) 


3。 垃 圾 回收 


吃 太 多 ， 总 会 变 胖 ，Python 也 是 如 此 。 当 Python 中 的 对 象 越 来 越 
多 时 ， 它 们 将 占据 越 来 越 大 的 内 存 。 不 过 你 不 用 太 担 心 Python 的 体 
形 ， 它 会 乖巧 的 在 适当 的 时 候 * 减 肥 ”， 启 动 垃圾 回收 (Garbage 


Collection) ， 将 没 用 的 对 象 清除 。 许 多 语言 中 都 有 垃圾 回收 机 制 ， 比 
如 Java 和 Ruby。 尽 管 最 终 目的 都 是 塑造 盏 条 的 体形 ， 但 不 同 语言 的 减 
肥 方 案 有 很 大 的 差异 。 


原理 上 ， 当 Python 的 某 个 对 象 的 引用 计数 降 为 0， 即 没有 任何 引用 
指向 该 对 象 时 ， 该 对 象 就 成 为 要 被 回收 的 垃圾 了 。 比 如 某 个 新 建 对 
象 ， 它 被 分 配给 某 个 引用 ， 对 象 的 引用 计数 变 为 1。 如 果 引 用 被 删除 ， 
对 象 的 引用 计数 为 0， 那 么 该 对 象 就 可 以 被 垃圾 回收 。 比 如 下 面 的 表 : 


a = [1, 2, 3] 
del a 


del a 后 ， 已 经 没有 任何 引用 指向 之 前 建立 的 [1 2, 3] 这 个 表 了 ， 即 
用 户 不 可 能 通过 任何 方式 接触 或 者 动用 这 个 对 象 。 这 个 对 象 如 果 继 续 
待 在 内 存 里 ， 就 成 为 不 健康 的 脂肪 。 当 垃圾 回收 启动 时 ，Python 扫 描 
到 这 个 引用 计数 为 0 的 对 象 ， 就 会 将 它 所 占据 的 内 存 清 空 。 


然而 ， 减 肥 是 个 昂贵 而 费力 的 事情 。 垃 圾 回收 时 ，Python 不 能 进 
行 其 他 的 任务 。 频 繁 的 垃圾 回收 将 大 大 降低 Python 的 工作 效率 。 如 果 
内 存 中 的 对 象 不 多 ， 就 没有 必要 频繁 启动 垃圾 回收 。 所 以 ，Python 只 
会 在 特定 条 件 下 ， 自 动 启动 垃圾 回收 。 当 Python 运行 时 ， 会 记录 其 中 
分 配对 象 (Object Allocation) 和 取消 分 配对 象 (Object Deallocation) 
的 次 数 。 当 两 者 的 差 值 高 于 某 个 阅 值 时 ， 垃 圾 回收 才 会 启动 。 


我 们 可 以 通过 gc 模块 的 get_threshold() 方 法 ， 查 看 该 阅 值 : 


Import gc 


print(gc.get_threshold() ) 


返回 (700, 10,10) ， 后 面 的 两 个 10 是 与 分 代 回 收 相关 的 阅 值 ， 后 
文中 会 详细 说 明 。700 即 垃圾 回收 启动 的 阅 值 。 可 以 通过 gc 中 的 
set_threshold() 方 法 重新 设置 。 当 然 ， 我 们 也 可 以 手动 启动 垃圾 回收 ， 
即使 用 gc.collect()。 


除了 上 面 的 基础 回收 方式 外 ，Python 同 时 还 采用 了 分 代 
(Generation) 回收 的 策略 。 这 一 策略 的 基本 假设 是 ， 存 活 时 间 越 久 的 
对 象 ， 越 不 可 能 在 后 面 的 程序 中 变 成 垃圾 。 我 们 的 程序 往往 会 产生 大 
量 的 对 象 ， 许 多 对 象 很 快 产生 和 消失 ,但 也 有 一 些 对 象 长 期 被 使 用 。 
出 于 信任 和 效率 ， 对 于 这 样 一 些 “ 长 寿 ” 对 象 ， 我 们 相信 它们 还 有 用 
处 ， 所 以 减少 在 垃圾 回收 中 扫描 它们 的 频率 。 


Python 将 所 有 的 对 象 分 为 0(、1、2 三 代 。 所 有 的 新 建 对 象 都 是 0 代 
对 象 。 当 某 一 代 对 象 经 历 过 垃圾 回收 ， 依 然 存活 ， 那 么 它 就 被 归 入 下 
一 代 对 象 。 垃 圾 回收 启动 时 ， 一 定 会 扫描 所 有 的 0 代 对 象 。 如 果 0 代 经 
过 一 定 次 数 垃圾 回收 ， 那 么 就 启动 对 0 代 和 1 代 的 扫描 清理 。 当 1 代 也 经 
历 了 一 定 次 数 的 垃圾 回收 后 ， 就 会 启动 对 0、1、2 代 的 扫描 ， 即 对 所 有 
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这 两 个 次 数 即 上 面 get_threshold0 返 回 的 (700, 10,10) 返回 的 两 
个 10。 也 就 是 说 ， 每 10 次 0 代 垃 圾 回收 ， 会 配合 1 次 1 代 的 垃圾 回收 ; 而 
每 10 次 1 代 的 垃圾 回收 ， 才 会 有 1 次 2 代 的 垃圾 回收 。 


同样 可 以 用 set_threshold0 来 调 束 次 数 ， 比 如 对 2 代 对 象 进行 更 频 莹 
的 扫描 。 


Import gc 


gc.set_threshold(700, 10, 5) 


4. 孤立 的 引用 环 


引用 环 的 存在 会 给 上 面 的 垃圾 回收 机 制 带 来 很 大 的 困难 。 这 些 引 
用 环 可 能 构成 无 法 使 用 ， 但 引用 计数 不 为 0 的 一 些 对 象 : 


a = [] 
b = [a] 


fab] 


.append(b) 
del a 
del b 


上 面 我 们 先 创建 了 两 个 表 对 象 ， 并 引用 对 方 ， 构 成 一 个 引用 环 。 
删除 了 a、b 引 用 之 后 ， 这 两 个 对 象 不 可 能 再 从 程序 中 调用 ， 因 而 就 没 
有 什么 用 处 了 。 但 是 由 于 引用 环 的 存在 ， 这 两 个 对 象 的 引用 计数 都 没 
有 降 到 0， 所 以 不 会 被 垃圾 回收 ， 如 图 6-2 所 示 。 


来 自 其 他 对 象 的 引用 


图 6-2 ”孤立 的 引用 环 


为 了 回收 这 样 的 引用 环 ，Python 会 复制 每 个 对 象 的 引用 计数 ， 可 
以 记 为 gc_ref。 假 设 ， 每 个 对 象 i， 该 计数 为 gc_ref_ i。Python 会 遍历 所 
有 的 对 象 i。 对 于 每 个 对 象 所 引用 的 对 象 j， 将 相应 的 gc_ref j 减 1， 遍 
历 后 的 结果 如 图 6-3 所 示 。 


来 自 
其 他 对 象 的 引用 


图 6-3 ”遍历 后 的 结果 


在 结束 遍历 后 ，gc_ref 不 为 0 的 对 象 ， 和 这 些 对 象 引 用 的 对 象 ， 以 
及 继续 更 下 游 引 用 的 对 象 ， 需 要 被 保留 ， 而 其 他 对 象 则 被 垃圾 回收 。 


Python 作为 一 种 动态 类 型 的 语言 ， 其 对 象 和 引用 分 离 。 这 与 曾经 
的 面向 过 程 语言 有 很 大 的 区 别 。 为 了 有 效 地 释放 内 存 ，Python 内 置 了 
垃圾 回收 的 支持 。Python 采 取 了 一 种 相对 简单 的 垃圾 回收 机 制 ， 即 引 
用 计数 ， 并 因此 需要 解决 孤立 引用 环 的 问题 。Python 与 其 他 语言 用 有 
共通 性 ， 又 有 特别 的 地 方 。 对 内 存 管 理 机 制 的 理解 ， 是 提高 Python 性 
能 的 重要 一 步 。 


(1) Python 中 还 有 一 个 __getattribute _() 特 殊 方 法 ， 用 于 查询 任意 属性 。 
(2) objgraph 是 Python 的 一 个 第 三 方 包 ， 可 以 使 用 pip 安 装 。 


第 7 章 ”函数 陈 编程 


7.1 又 见 函 数 
7.2 ”被 解放 的 函数 
7.3 ”小 女子 的 梳妆 匣 

7.4 SNA 


75 ” 自 上 而 下 


本 章 我 们 将 介绍 一 种 新 的 编程 范式 : 水 数 式 编程 (Functional 
Programming) 。 函 数 式 编程 历史 悠久 ， 但 其 使 用 一 直 限 于 学 术 圈 。 随 
着 近年 来 并 行 运算 的 发 展 ， 人 们 发 现 古 老 的 水 数 式 编程 天 生地 适用 于 
并 行 运算 。 国 数 式 编程 变 得 越 来 越 受 欢迎 。Python 虽 然 不 是 纯粹 的 函 
数 式 编程 ， 但 包含 了 不 少 函 数 式 编程 的 语法 。 了 解 函 数 式 编程 的 概 
念 ， 有 助 于 写 出 更 加 优秀 的 代码 。 
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在 前 面 ， 我 们 已 经 见 到 了 面向 过 程 和 面向 对 象 两 种 编程 范式 。 面 
向 过 程 编 程 利用 选择 和 循环 结构 ， 以 及 冰 数 、 模 块 等 ， 对 指令 进行 圭 
装 。 面 向 对 象 实 现 了 另 一 种 形式 的 封装 。 包 含有 数据 的 对 象 的 一 系列 
方法 。 这 些 方法 能 造成 对 象 的 状态 改变 。 作 为 第 三 种 编程 范式 ， 函 数 
式 编 程 的 本 质 也 在 于 封装 。 


正如 其 名 字 ， 阔 数 式 编程 以 为 数 为 中 心 进行 代码 封装 。 在 面向 过 
程 的 编程 中 ， 我 们 已 经 见识 过 函数 。 它 有 参数 和 返回 值 ， 分 别 起 到 输 
入 和 输出 效 据 的 功能 。 更 进一步 ， 我 们 也 已 经 知道 Python 中 的 函数 实 
际 上 是 一 些 特 殊 的 对 象 。 这 一 条 已 经 符合 了 函数 式 编程 的 一 个 重要 方 
面 : 为数 是 第 一 级 对 象 ， 能 像 普通 对 象 一样 使 用 。 我 将 在 后 面 章节 中 
探索 它 的 重要 意义 。 


函数 式 编程 强调 了 函数 的 纯粹 性 (purity) 。 一 个 纯 函 数 是 没有 副 
作用 的 (Side Effect) ， 即 这 个 函数 的 运行 不 会 影响 其 他 函数 。 纯 函数 
像 一 个 沙 盒 ， 把 函数 带 来 的 效果 控制 在 内 部 ， 从 而 不 影响 程序 的 其 他 
部 分 。 我 们 曾 在 函数 内 部 改变 外 部 列表 的 元 素 ， 其 他 调用 该 列表 的 函 
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成 这 样 效果 的 原因 是 我 们 使 用 了 可 变更 的 对 象 ， 如 列表 和 词典 。 因 
此 ， 为 了 达到 纯 阔 数 的 标准 ， 函 数 式 编 程 要 求 其 变量 都 是 不 可 变更 
的 。 


Python 并 非 完全 的 函数 式 编程 语 言 。 在 Python 中 ， 存 在 着 可 变更 
的 对 象 ， 也 能 写 出 非 纯 函数 。 但 如 果 我 们 借鉴 函数 式 编程 ， 尽 量 在 编 
程 中 避免 副作用 ， 就 会 有 许多 好 处 。 由 于 纯 遂 数 相 互 独立 ， 我 们 不 用 
担心 水 数 调 用 对 其 他 水 数 的 影响 ， 所 以 使 用 起 来 更 加 简单 。 另 外 一 
点 ， 纯 函数 也 方便 进行 并 行 化 运算 。 在 并 行 化 编程 时 ， 我 们 经 常 要 担 
心 不 同 进程 之 间 相 互 干扰 的 问题 。 当 多 个 进程 同时 修改 一 个 变量 时 ， 
进程 的 先后 顺序 会 影响 最 终结 果 。 比 如 下 面 两 个 国 数 : 


from threading import Thread 


def double(): 


global x 


x=x ”2 


def plus_ten(): 
global x 


X = x + 10 


threadi = Thread(target=double) 
thread2 = Thread(target=plus_ten) 
thread1.start() 

thread2.start() 

thread1.join() 


thread2.join() 


print(x) 


上 面 的 两 个 函数 中 使 用 了 关键 字 global。global 说 明了 x 是 一 个 全 局 
变量 。 函 数 对 全 局 变量 的 修改 能 被 其 他 函数 看 到 ， 因 此 有 副作用 。 如 
果 两 个 进程 并 行 地 执行 两 个 水 数 ， 遂 数 的 执行 顺序 不 确定 ， 则 结果 可 
能 是 double() 中 的 x = x 2 先 执行 ， 最 终结 果 为 20; 也 有 可 能 是 plus_ten() 
中 的 x = x + 10 先 执行 ， 最 终结 果 为 30。 这 被 称 为 况 跑 条 件 (Race 
Condition) ， 是 并 行 编程 中 需要 极力 避免 的 。 


函数 式 编 程 消灭 了 副作用 ， 即 无 形 中 消除 了 竞 跑 条 件 的 可 能 。 因 
此 ， 阔 数 式 编程 天 生地 适用 于 并 行 化 运算 。 其 实 函 数 式 编 程 诞生 得 很 
早 ， 早 在 20 世 纪 50 年 代 ，Lisp 语 言 就 已 经 诞生 。 但 函数 式 编程 的 使 用 
范围 局 限于 学 术 领 域 。 近 年 来 ， 电 子 元 件 的 尺寸 已 经 趋 于 物理 极限 。 
CPU 频率 的 增长 逐渐 放 缓 。 为 了 满足 运算 的 需要 ， 人 们 想到 了 把 多 个 
电脑 连接 起 来 ， 用 并 行 化 的 方式 来 提高 运算 能 力 。 但 并 行程 序 与 之 前 


的 单线 程 程序 有 很 大 区 别 ， 程 序 员 要 处 理 竞 跑 条 件 等 复杂 问题 。 饱 受 
折磨 的 程序 员 想 起 了 古董 级 的 函数 式 编程 语言 ， 意 外 地 发 现 它 十 分 适 
合 于 编写 并 行程 序 。 于 是 ， 函 数 式 编 程 重 拾 热度 ， 渐 渐 成 为 程序 员 的 
必修 内 容 。 


Python 并 非 一 门 函数 式 编程 语言 。 在 早期 的 Python 版 本 中 ， 并 没 
有 国 数 式 编 程 的 相关 语法 。 后 来 Python 中 加 入 了 lambda 国 数 ， 以 及 
map、filter、reduce 等 高 阶 函 数 ， 从 而 加 入 了 函数 式 编 程 的 特征 。 但 
Python 并 没有 严格 地 执行 语法 规范 ， 并 且 缺 乏 相 关 的 优化 ， 因 此 离 完 
整 的 水 数 式 编程 尚 有 一 段 距离 。Python 的 作者 罗 苏 姆 本 人 也 从 不 认为 
Python 是 一 门 疯 数 式 语 言 。 作 为 一 名 渐进 式 的 开发 者 ， 罗 苏 姆 非常 看 
重 程序 的 可 读 性 。 因 此 ， 他 只 保留 了 函数 式 编程 中 那些 让 Python 更 加 
简洁 的 语法 糖 。 所 以 ，Python 中 国 数 式 语 法 特征 可 以 作为 体验 的 起 
点 。 但 这 还 远 远 不 够 ， 你 至 少 应 该 去 深入 了 解 疯 数 式 编程 的 思想 。 更 
好 的 情况 是 ， 你 能 学 习 一 门 更 加 纯粹 的 函数 式 语 言 ， 与 Python 中 的 所 
学 互 为 对 照 。 


在 我 的 体会 中 ， 学 习 遂 数 式 编程 能 深刻 地 影响 编程 的 思维 方式 。 
程序 员 编 程 时 ， 很 多 时 候 是 自 下 而 上 的 : 创建 一 个 变量 ， 给 变量 赋 
值 ， 进 行 运 算 ， 得 到 结果 .……. 这 是 一 种 很 自然 的 想法 。 程 序 员 毕 竟 是 
在 摆弄 机 器 ， 因 此 第 一 步 总 会 像 第 一 次 玩 收 吾 机 一 样 ， 转 转 按钮 、 动 
动 天 线 ， 看 一 下 机 器 是 什么 反应 。 与 之 相对 ， 冰 数 式 编程 的 思路 是 自 
上 而 下 的 。 它 先 提出 一 个 大 问题 ， 在 最 高 层 用 一 个 遂 数 来 解决 这 个 大 
问题 。 在 这 个 函数 内 部 ， 再 用 其 他 函数 来 解决 小 问题 。 在 这 样 递归 式 
的 分 解 下 ， 直 到 问题 得 到 解决 。 这 就 好 像 * 把 大 象 放 入 冰箱 ”这 个 函 
数 ， 在 内 部 调用 “打开 | 门 ”“ 把 大 象 放 进去 、“ 关 上 门 ” 这 三 个 函数 。 
在 这 三 个 内 部 阔 数 中 ， 可 以 继续 通过 函数 调用 ， 向 细节 深入 。 这 两 种 


思维 方式 各 有 利 浆 ， 但 让 它们 相互 对 比 、 相 互 碰撞 ， 是 学 习 编 程 的 一 
大 乐趣 。 


Am Am 
2。 并 行 运算 
在 上 一 节 中 ， 我 们 已 经 涉及 到 并 行 运算 。 所 谓 的 并 行 运算 ， 是 指 


多 条 指令 同时 执行 。 一 般 来 说 ， 一 人 台 单 处 理 器 的 计算 机 同一 时 间 内 只 
能 执行 一 条 指令 。 这 种 每 次 执行 一 条 指令 的 工作 方式 称 为 串 行 运算 。 


图 7-1 ”品行 运算 : 必须 一 个 一 个 来 


大 规模 并 行 运算 通常 是 在 有 多 个 主机 组 成 的 集群 (Cluster) bit 
行 的 。 主 机 之 间 可 以 借助 高 速 的 网 络 设备 通信 。 一 个 集群 的 造价 不 
菲 。 然 而 ， 我 们 可 以 在 单机 上 通过 多 进程 或 多 线程 的 方式 ， 模 拟 多 主 
机 的 并 行 处 理 。 即 使 一 台 单 机 中 ， 也 往往 存在 着 多 个 运行 着 的 程序 ， 
即 所 谓 的 进程 。 例 如 ， 我 们 在 打开 浏览 器 上 网 的 同时 ， 还 可 以 流畅 的 


听 音 乐 。 这 给 我 们 一 个 感觉 ,计算 机 在 并 行 的 进行 上 网 和 放 音 乐 两 个 
任务 。 事 实 上 ， 单 机 的 处 理 器 按照 “分 时 复 用 ”的 方式 ， 把 运算 能 力 分 
配给 多 个 进程 。 处 理 器 在 进程 间 频 每 切换 。 因 此 ， 即 使 处 理 器 同一 时 
间 只 能 处 理 一 个 指令 ， 但 通过 在 进程 间 的 切换 ， 也 能 造成 多 个 进程 齐 
头 并 进 的 效果 。 


图 7-2 ”并 行 运算 : 可 以 齐头并进 


从 这 个 角度 来 说 ， 集 群 和 单机 都 实现 了 多 个 进程 的 并 行 运算 。 只 
不 过 ， 集 群 上 的 多 进程 分 布 在 不 同 的 主机 ， 而 单机 的 多 进程 存在 于 同 
一 主机 ， 并 借 着 “分 时 复 用 ”来 实现 并 行 。 


下 面 是 多 进程 编程 的 一 个 例子 : 


import multiprocessing 


def proci(): 


return 999999° "9999 


def proc2(): 


return 888888 8888 


p1 = multiprocessing.Process(target=proc1) 


p2 = multiprocessing.Process(target=proc2) 


pi.start() 
p2.start() 


pi. join( ) 
p2.join( ) 


上 面 程序 用 了 两 个 进程 。 进 程 的 工作 包含 在 图 数 中 ， 分 别 是 函数 
proc10 和 函数 proc20。 方 法 start0) 用 于 启动 进程 ， 而 join0) 方 法 用 于 在 主 
程序 中 等 待 相 应 进程 完成 。 


最 后 ， 我 们 要 区 分 一 下 多 进程 和 多 线程 。 一 个 程序 运行 后 ， 就 成 
为 一 个 进程 。 进 程 有 上 自己 的 内 存 空间 ， 用 来 存储 自身 的 运行 状态 、 数 
据 和 相关 代码 。 一 个 进程 一 般 不 会 直接 读 取 其 他 进程 的 内 存 空间 。 进 
程 运行 过 程 中 ， 可 以 完成 程序 描述 的 工作 。 但 在 一 个 进程 内 部 ， 又 可 
以 有 多 个 称 为 “线程 ”的 任务 ， 处 理 器 可 以 在 多 个 线程 之 间 切 换 ， 从 而 
形成 并 行 的 多 线程 处 理 。 线 程 看 起 来 和 进程 类 似 ， 但 线程 之 间 可 以 共 
享 同一 个 进程 的 内 存 空间 。 


7.2 ”被 解放 的 函数 


1. 水 数 作为 参数 和 返回 值 


在 函数 式 编程 中 ， 函 数 是 第 一 级 对 象 。 所 谓 * 第 一 级 对 象 ”， 即 函 
效能 像 普通 对 象 一 样 使 用 。 因 此 ， 函 数 的 使 用 变 得 更 加 自由 。 对 于 "一 
切 皆 对 象 "的 Python 来 说 ， 这 是 自然 而 然 的 结果 。 既 然 如 此 ， 那 么 函数 
可 以 像 一 个 普通 对 象 一 样 ， 成 为 其 他 函数 的 参数 。 比 如 下 面 的 程序 ， 
RMI SSE: 


def square_sum(a, b): 


return a 2 +b 2 


def cubic_sum(a, b): 


return a 3 +b 3 


def argument_demo(f, a, b): 


return f(a, b) 


print(argument_demo(square_sum, 3, 5)) # 打印 34 


print(argument_demo(cubic_sum, 3, 5)) # 打印 152 


孙 数 argument_demo0 的 第 一 个 参数 {f 就 是 一 个 函数 对 象 。 按 照 位 置 
传 参 ，square_sum(0 传 递 给 图 数 argument_demo0 ， 对 应 参数 列表 中 的 
f。f 会 在 argument_demo0 中 被 调用 。 我 们 可 以 把 其 他 函数 ， 如 
cubic_sum() 作 为 参数 传递 给 argument_demo()。 


很 多 语言 都 能 把 函数 作为 参数 使 用 ， 例 如 C 语 言 。 在 图 形 化 界面 
编程 时 ， 这 样 一 个 作为 参数 的 图 数 经 常 起 到 回调 (Callback) 的 作 
用 。 当 某 个 事件 发 生 时 ， 比 如 界面 上 的 一 个 按钮 被 按 下 ， 回 调 函 数 就 
会 被 调用 。 下 面 是 一 个 GUI 回调 的 例子 : 


import tkinter as tk 


def callback(): 


callback function for button click 


listbox.insert(tk.END, "Hello World!") 


if name == " main _": 


master = tk.Tk() 


button = tk.Button(master, text="0K", command=callback ) 


button.pack() 


listbox = tk.Listbox(master ) 


listbox.pack() 


tk.mainloop( ) 


Python 中 内 置 了 tkinter 的 图 形 化 功能 。 在 上 面 的 程序 中 ， 回 调 函 数 
将 在 列表 栏 中 插入 "Hello World!"。 回 调 函 数 作 为 参数 传 给 按钮 的 构造 
器 。 每 当 按 钮 被 点 击 时 ， 回 调 孙 数 就 会 被 调用 ， 如 图 7-3 所 示 。 


OO@ tk 


图 7-3 ”回调 函数 运行 结果 


2. KAFR EE 


既然 阔 数 是 一 个 对 象 ， 那 么 它 就 可 以 成 为 另 一 个 函数 的 返回 结 
Ro 


def line_conf(): 
def line(x): 


return 2°x+1 


return line # return a function object 


my_line = line_conf() 


print (my_line(5)) # 打印 11 


上 面 的 代码 可 以 成 功 运 行 。line_confO 的 返回 结果 被 赋 给 line 对 
象 。 上 面 的 代码 将 打印 11。 


在 上 面 的 例子 中 ， 我 们 看 到 了 在 一 个 函数 内 部 定义 的 函数 。 和 子 
数 内 部 的 对 象 一 样 ， 遂 数 对 象 也 有 存活 范围 ， 也 就 是 水 数 对 象 的 作用 
域 。Python 的 缩 进 形式 很 容易 让 我 们 看 到 函数 对 象 的 作用 域 。 函 数 对 
象 的 作用 域 与 它 的 def 的 缩 进 层级 相同 。 比 如 下 面 的 代码 ， 我 们 在 
line_confO 函 数 的 隶属 范围 内 定义 的 函数 line0)， 就 只 能 在 line_confO 的 
隶属 范围 内 调用 。 


def line_conf(): 
def line(x): 
return 2 x+1 


print(line(5)) # 作 用 域内 


if name__==""—_ main 


line_conf() 


print(line(5)) # 作 用 域外 ， 报 错 


孙 数 line0 定 义 了 一 条 直线 (y = 2x + 1)。 可 以 看 到 ， 在 line_conf() 中 
可 以 调用 line0 函 数 ， 而 在 作用 域 之 外 调用 line0 阔 数 将 会 有 下 面 的 错 


TR: 


NameError: name 'line' is not defined 


MAX BABY T WMline( PFA. Python wiZ EX AY Va FAA 
败 。 


3。 闭 包 


上 面 阔 数 中 ，line0 定 义 眩 套 在 另 一 个 函数 内 部 。 如 果 上 函数 的 定义 
中 引用 了 外 部 变量 ， 会 发 生 什么 呢 ? 


def line_conf(): 
b = 15 
def line(x): 
return 2 x+b 
b = 5 
return line # 返 回国 数 对 象 


if _name_ == " main _": 


my_line = line_conf() 


print(my_line(5)) # 打印 15 


可 以 看 到 ，line0 定 义 的 隶属 程序 块 中 引用 了 高 层级 的 变量 b。b 的 
定义 并 不 在 line0 的 内 部 ， 而 是 一 个 外 部 对 象 。 我 们 称 b 为 line0 的 环境 
变量 。 尽 管 b 位 于 line0 定 义 的 外 部 ， 但 当 line 被 负数 line_confO 返 回 
时 ， 还 是 会 带 有 b 的 信息 。 


一 个 函数 和 它 的 环境 变量 合 在 一 起 ， 就 构成 了 一 个 闭 包 

(Closure) 。 上 面 程序 中 ，b 分 别 在 line() 定 义 的 前 后 有 两 次 不 同 的 赋 

(Bo CATES SFT EIS, miei, line SPRAY EIR A SADIE} 
此 ， 闭 包 中 包含 的 是 内 部 函数 返回 时 的 外 部 对 象 的 值 。 


oa 所 谓 的 闭 包 是 一 个 包含 有 环境 变量 取 值 的 函数 对 
象 。 环 境 变 量 取 值 被 复制 到 函数 对 象 的 _closure 属性 中 。 比 如 下 面 
的 代码 : 


def line_conf(): 
b = 15 


def line(x): 


return 2°x+b 


b=5 
return line # 返回 水 数 对 象 


if name == " main __ 


my_line = line_conf() 
print(my_line.__closure__) 


print(my_line.__closure__[0].cell_contents) 


可 以 看 到 ，my_line() 的 _dlosure “属性 中 包含 了 一 个 元 组 。 这 个 
元 组 中 的 每 个 元 素 都 是 cell 类 型 的 对 象 。 第 一 个 cell 包 含 的 就 是 整数 5， 
也 就 是 我 们 返回 闭 包 时 的 环境 变量 b 的 取 值 。 


闭 包 可 以 提高 代码 的 可 复 用 性 。 我 们 看 下 面 三 个 函数 : 


def line1i(x): 


return x + 1 


def line2(x): 


return 4°x + 1 


def line3(x): 


return 5°x + 10 


def line4(x): 


return -2°x - 6 


如 果 把 上 面 的 程序 改 为 闭 包 ， 那 么 代码 就 会 简单 很 多 : 


def line_conf(a, b): 
def line(x): 
return ax +b 


return line 


linet = line_conf(1, 1) 
line2 = line_conf(4, 5) 
line3 = line_conf(5, 10) 


line4 = line_conf(-2, -6) 


这 个 例子 中 ， 函 数 line0) 与 环境 变量 c、b 构 成 闭 包 。 在 创建 闭 包 的 
时 候 ， 我 们 通过 line_conf() 的 参数 a、b 说 明 直 线 的 参量 。 这 样 ， 我 们 就 
能 复 用 同一 个 闭 包 ， 通 过 代入 不 同 的 数据 来 获得 不 同 的 直线 阅 数 ， 如 y 
= x+1 和 y = 4x + 5。 闭 包 实 际 上 创建 了 一 群 形式 相似 的 冰 数 。 


除了 复 用 代码 ， 闭 包 还 能 起 到 减少 函数 参数 的 作用 : 


def curve_closure(a, b, c): 


def curve(x): 


return ax 2+bx +c 


return curve 


curve1 = curve_closure(1i, 2, 1) 


国 数 curve0) 是 一 个 二 次 图 数 。 它 除了 自 变 量 x 外 ， 还 有 a、b、<c 三 
个 参数 。 通 过 curve_closure0 这 个 闭 包 ， 我 们 可 以 预 设 a、b、c 三 个 参 
数 的 值 。 从 而 起 到 减 参 的 效果 。 


闭 包 的 减 参 作用 对 于 并 行 运算 来 说 很 有 意义 。 在 并 行 运算 的 环境 
下 ， 我 们 可 以 让 每 台电 脑 负责 一 个 函数 ， 把 上 一 台电 脑 的 输出 和 下 一 
台电 脑 的 输入 串联 起 来 。 最 终 ， 我 们 像 沅 水 线 一 样 工作 ， 从 串联 的 电 
脑 集群 一 端 输 入 数据 ， 从 另 一 端 输出 数据 。 由 于 每 台电 脑 只 能 接收 一 
个 输入 ， 所 以 在 串联 之 前 ， 必 须 用 闭 包 之 类 的 办 法 把 参数 的 个 数 降 为 
lo 


7.3 ”小 女子 的 梳妆 车 
1. 装饰 器 


装饰 器 (decorator) 是 一 种 高 级 Python 语 法 。 装 饰 器 可 以 对 一 个 
国 数 、 方 法 或 者 类 进行 加 工 。 在 Python 中 ， 我 们 有 多 种 方法 对 孙 数 和 
类 进行 加 工 。 装 饰 器 从 操作 上 入 手 ， 为 水 数 增加 额外 的 指令 。 因 此 ， 
装饰 器 看 起 来 就 像 是 女孩 子 的 梳妆 车， 一 番 打 扮 之 后 让 遂 数 大 变样 。 
Python 最 初 没 有 装饰 器 这 一 语法 。 闭 饰 器 在 Python 2.5 中 才 出 现 ， 最 初 
只 用 于 函数 。 在 Python 2.6 以 及 之 后 的 Python 版 本 中 ， 装 饰 器 被 进一步 
用 于 类 。 


我 们 先 定义 两 个 简单 的 数学 函数 ， 一 个 用 来 计算 平方 和 ， 一 个 用 
来 计算 平方 差 : 


# 获得 平方 和 
def square_sum(a, b): 


return a 2 +b 2 # get square diff 


# 获得 平方 差 
def square_diff(a, b): 


return a 2 - b 2 


if _ name__ == "__main__": 
print(square_sum(3, 4) ) # 打印 25 
print(square_diff(3, 4) # 打印 -7 


在 拥有 了 基本 的 数学 功能 之 后 ， 我 们 可 能 想 为 水 数 增加 其 他 的 功 
能 ， 比 如 打印 输入 。 我 们 可 以 改写 函数 来 实现 这 一 点 : 


# 装饰 : 打印 输入 


def square_sum(a, b): 
print("intput:", a, b) 


return a 2+ b 2 


def square_diff(a, b): 


print("input", a, b) 


return a 2 - b 2 
if _name == "main ": 
print(square_sum(3, 4)) 


print(square_diff(3, 4)) 


我 们 修改 了 函数 的 定义 ， 为 图 数 增加 了 功能 。 从 代码 中 可 以 看 
到 ， 这 两 个 水 数 在 功能 上 的 拓展 有 很 高 的 相似 性 ， 都 是 增加 了 
print("input", a, b) 这 一 打印 功能 。 我 们 可 以 改 用 装饰 器 ， 定 义 功能 拓展 
A, BRATS: 


def decorator_demo(old_function): 
def new_function(a, b): 
print("input", a, b) # 额外 的 打印 操作 
return old_function(a, b) 


return new_function 


@decorator_demo 
def square_sum(a, b): 


return a 2 +b 2 


@decorator_demo 
def square_diff(a, b): 


return a 2 -b 2 


if _name == "” main _": 
print(square_sum(3, 4)) 


print(square_diff(3, 4)) 


装饰 器 可 以 用 def 的 形式 定义 ， 如 上 面 代码 中 的 decorator_demo0)。 
装饰 器 接收 一 个 可 调用 对 象 作 为 输入 参数 ， 并 返回 一 个 新 的 可 调用 对 
象 。 妆 饰 器 新 建 了 一 个 函数 对 象 ， 也 就 是 上 面 的 new_function0)。 在 
new_function() 中 ， 我 们 增加 了 打印 的 功能 ， 并 通过 调用 old_function(a,， 
b) 来 保留 原 有 函数 的 功能 。 


定义 好 装饰 器 后 ， 我 们 就 可 以 通过 @ 语 法 使 用 了 。 在 函数 
square_sum() 和 square_diff() 定 义 之 前 调用 @decorator_demo， 实 际 上 是 
将 square_sum() 或 square_diff() 传递 给 了 decorator_demo(), 并 将 
decorator_demo()3& [E] BY At BY ERI EX AT R IEA ER SRY ER 2X square_sum() 
和 square_diff()。 所 以 ， 当 我 们 调用 square_sum(3, 4) 的 时 候 ， 实 际 上 发 
生 的 是 : 


square_sum = decorator_demo(square_sum) 


square_sum(3, 4) 


我 们 知道 ，Python 中 的 变量 名 和 对 象 是 分 离 的 。 变 量 名 其 实 是 指 
向 一 个 对 象 的 引用 。 从 本 质 上 ， 装 饰 器 起 到 的 作用 就 是 名 称 绑 定 
(name binding) ， 让 同一 个 变量 名 指向 一 个 新 返回 的 函数 对 象 ， 从 而 
达到 修改 钞 数 对 象 的 目的 。 只 不 过 ， 我 们 很 少 彻 底 地 更 改 函 数 对 象 。 


在 使 用 装饰 器 时 ， 我 们 往往 会 在 新 函数 内 部 调用 旧 的 函数 ， 以 便 保 留 
上 日 冰 数 的 功能 。 这 也 是 “装饰 ?名 称 的 由 来 。 


下 面 看 一 个 更 有 实用 功能 的 装饰 器 。 我 们 可 以 利用 time 包 来 测量 
程序 运行 的 时 间 。 把 测量 程序 运行 时 间 的 功能 做 成 一 个 装饰 器 ， 将 这 
个 装饰 器 运用 于 其 他 函数 ， 将 显示 函数 的 实际 运行 时 间 : 


import time 


def decorator_timer(old_function): 


def new_function('arg, © dict_arg): 


t1 = time.time() 


result = old_function(‘arg, ~dict_arg) 
t2 = time.time() 

print("time: ", t2 - t1) 

return result 


return new_function 


在 new_function0 中 ， 除 调用 旧 函 数 外 ， 还 前 后 额外 调用 了 一 次 
time.time()。 由 于 time.time() 返 回 挂钟 时 间 ， 它 们 的 差 值 反映 了 旧 遂 数 
的 运行 时 间 。 此 外 ， 我 们 通过 打包 参数 的 办 法 ， 可 以 在 新 函数 和 旧 辑 
数 之 间 传 递 所 有 的 参数 。 


闭 饰 器 可 以 实现 代码 的 可 复 用 性 。 我 们 可 以 用 同一 个 装饰 器 修饰 
多 个 水 数 ， 以 便 实现 相同 的 附加 功能 。 比 如 说 ， 在 建设 网 站 服务 器 


时 ， 我 们 能 用 不 同 函 数 表示 对 不 同 HITP 请 求 的 处 理 。 当 我 们 在 每 次 处 
理 HTTP 请 求 前 ， 都 想 附加 一 个 客户 验证 功能 时 ， 那 么 就 可 以 定义 一 个 
统一 的 装饰 器 ， 作 用 于 每 一 个 处 理沙 数 。 这 样 ， 程 序 能 重复 利用 ， 可 
读 性 也 大 为 提高 。 


2 。 带 参 装饰 器 


在 上 面 的 装饰 器 调用 中 ， 比 如 @decorator_demo， 该 装饰 器 默认 它 
后 面 的 函数 是 唯一 的 参数 。 装 饰 器 的 语法 允许 我 们 调用 decorator 时 ， 
提供 其 他 参数 ， 比 如 @decorator(a)。 这 样 ， 就 为 装饰 器 的 编写 和 使 用 
提供 了 更 大 的 灵活 性 。 


# 带 参 装饰 器 
def pre_str(pre=""): 
def decorator(old_function): 
def new_function(a, b): 
print(pre + "input", a, b) 
return old_function(a, b) 
return new_function 


return decorator 


# 装饰 square_sum( ) 
@pre_str("^_^") 


def square_sum(a, b): 


return a 2 +b 2 # get square diff 


# 装饰 square_diff() 

@pre_str("T_T") 

def square_diff(a, b): 
return a 2-b 2 

if _ name == "__main_": 
print(square_sum(3, 4)) 


print(square_diff(3, 4)) 


上 面 的 pre_str 是 一 个 带 参 装饰 器 。 它 实际 上 是 对 原 有 装饰 器 的 一 
个 函数 封装 ， 并 返回 一 个 装饰 器 。 我 们 可 以 将 它 理解 为 一 个 含有 环境 
参量 的 闭 包 。 当 我 们 使 用 @pre_str("^^") 调 用 的 时 候 ，Python 能 够 发 现 
这 一 层 的 封装 ， 并 把 参数 传递 到 装饰 器 的 环境 中 。 该 调用 相当 于 : 


square_sum = pre_str("^ 人 ^") (square_sum) 


根据 参数 不 同 ， 带 参 装饰 器 会 对 函数 进行 不 同 的 加 工 ， 进 一 步 提 
高 了 装饰 器 的 适用 范围 。 还 是 以 网 站 的 用 户 验证 为 例子 。 装 饰 器 负责 
验证 的 功能 ， 装 饰 了 处 理 HTTP 请 求 的 函数 。 可 能 有 的 关键 HTTP 请 求 
需要 管理 员 权 限 ， 有 的 只 需要 普通 用 户 权 限 。 因 此 ， 我 们 可 以 把 “管理 
员 ” 和 “用 户 ” 作 为 参数 ， 传 递 给 验证 装饰 器 。 对 于 那些 负责 关键 HTTP 
请 求 的 函数 ， 我 们 可 以 把 “管理 员 ” 参 数 传 给 装饰 器 。 对 于 负责 普通 


HTTP 请 求 的 函数 ， 我 们 可 以 把 “用户 ” 参 数 传 给 它们 的 装饰 器 。 这 样 ， 
同一 个 装饰 器 就 可 以 满足 不 同 的 需求 了 。 


3. 装饰 类 


在 上 面 的 例子 中 ， 闪 和 饰 器 接收 一 个 国 效 ， 并 返回 一 个 为 效 ， 从 而 
起 到 加 工 消 数 的 效果 。 闭 饰 器 还 拓展 到 了 类 。 一 个 装饰 器 可 以 接收 一 
个 类 ， 并 返回 一 个 类 ， 从 而 起 到 加 工 类 的 效果 。 


def decorator_class(SomeClass): 

class NewClass(object): 
def _ init__(self, age): 
self.total_display = 0 
self .wrapped = SomeClass(age) 

def display(self): 
self.total_display += 1 
print("total display", self.total_display) 
self.wrapped.display( ) 


return NewClass 


@decorator_class 
class Bird: 
def _ init__(self, age): 
self.age = age 


def display(self): 


print("My age is",self.age) 


if _ name__ == "” main 
eagle_lord = Bird(5) 
for i in range(3): 


eagle _lord.display() 


在 于 饰 器 decorator_class 中 ， 我 们 返回 了 一 个 新 类 NewClass。 在 新 
类 的 构造 器 中 ， 我 们 用 一 个 属性 self.wrapped 记 录 了 原来 类 生成 的 对 
象 ， 并 附加 了 新 的 属性 total_display， 用 于 记录 调用 display0O 的 次 数 。 
我 们 也 同时 更 改 了 display 方 法 。 通 过 装饰 ， 我 们 的 Bird 类 可 以 显示 调 
用 display0O 的 次 数 。 


无 论 是 装饰 函数 ， 还 是 装饰 类 ， 装 饰 器 的 核心 作用 都 是 名 称 绑 
定 。 昌 然 装饰 器 端 出 现 较 晚 ， 但 在 各 个 Python 项 目 中 的 使 用 却 很 广 
泛 。 即 便 不 需要 自 定 义 装 饰 器 ， 你 也 很 有 可 能 会 在 自己 的 项 目 中 调用 
其 他 库 中 的 装饰 器 。 因 此 ，Python 程 序 员 需 要 掌握 这 一 语法 。 


7.4 AMAR 
1. lambda 与 map 
上 面 的 讲解 都 围绕 着 一 个 中 心 ， 函 数 能 像 一 个 普通 对 象 一 样 应 


用 ， 从 而 成 为 其 他 函数 的 参数 和 返回 值 。 能 接收 其 他 函数 作为 参数 的 
KA, WE AMA (high-order function) 。7.3 节 中 介绍 的 装饰 


器 ， 本 质 上 就 是 高 阶 函 数 。 高 阶 函 数 是 函数 式 编 程 的 一 个 重要 组 成 部 
分 。 本 节 我 们 讲 介 绍 最 具有 代表 性 的 高 阶 函 数 : mapO、fiter0 和 


reduce()o 


在 开始 之 前 ， 首 先 引 入 一 种 新 的 定义 国 数 的 方式 。 我 们 已 经 见 过 
很 多 用 def 来 定义 图 数 的 例子 。 除 了 def， 还 可 以 用 lambda 语 法 来 定义 匿 
Bee, PM: 


lambda_sum = lambda x,y: x + y 


print(lambda_sum(3, 4) ) 


通过 lambda， 我 们 创建 了 一 个 匿名 的 函数 对 象 。 借 着 赋值 语句 ， 
这 个 匿名 函数 赋予 给 图 数 名 lambda_sum。 国 数 的 参数 为 x、y， 返 回 值 
为 x 与 y 的 和 。 疯 数 lambda_sum() 的 调用 与 正常 水 数 一 样 。 这 种 用 
lambda 来 产生 匿名 函数 的 方式 适用 于 简短 孙 数 的 定义 。 


现在 我 们 来 看 高 阶 函 数 。 所 谓 高 阶 钞 数 ， 就 是 能 处 理 函 数 的 函 
数 。 在 第 1 章 中 ， 我 们 就 已 经 见 过 了 国 数 对 象 参 数 。 那 个 接收 函数 对 象 
为 参数 的 函数 ， 就 是 高 阶 函 数 。Python 中 提供 了 很 多 有 用 的 高 阶 函 
数 。 我 们 从 map0 开 始 介 绍 。 遂 数 map0 是 Python 的 内 置 冰 数 。 它 的 第 
一 个 参数 就 是 一 个 图 数 对 象 。 了 图 数 map(0 把 这 一 个 函数 对 象 作 用 于 多 个 
TUR: 


data_list = [1,3,5,6] 


result= map(lambda x: x+3,data_list) 


国 数 map0 的 第 二 个 参数 是 一 个 可 循环 对 象 。 对 于 data_list 的 每 个 
TA, lambda 孙 数 都 会 调用 一 次 。 那 个 元 素 会 成 为 lambda 汶 数 的 参 
数 。 换 个 角度 说 ，map0 把 接收 到 的 水 数 对 象 依 次 作用 于 每 一 个 元 素 。 
最 终 ，map0) 会 返回 一 个 迭代 器 四。 和 迭代 器 中 的 元 素 ， 就 是 多 次 调用 
lambda 了 为 数 的 结果 。 因 此 ， 上 面 的 代码 相当 于 : 


def equivalent_generator(func, iter): 
for item in iter: 


yield func(item) 


data_list = [1,3,5,6] 


result = map(lambda x: x+3, data_list) 


上 面 的 lambda 六 效 只 有 一 个 参 效 。 这 个 函数 也 可 以 是 一 个 多 人 参数 
的 阔 效 。 这 个 时 候 ，map0 的 参数 列表 中 融 需 要 提供 ARE RITE 
XT Ro 


def square_sum(x, y): 


return x 2+y 2 


data_listi = [1,3,5,7] 
data_list2 = [2,4,6,8] 


result= map(Ssquare_sum,data_list1i, data_list2) 


这 里 ，map0 接 收 了 square_sum0O 作 为 第 一 个 参数 。 数 square_sum0) 
要 求 有 两 个 参数 。 因 此 ，mapO 调 用 时 需要 两 个 可 循环 对 象 。 第 一 个 循 
环 对 象 提 供 了 square_sum() 中 对 应 于 x 的 参数 ， 第 二 个 循环 对 象 提供 了 
对 应 于 y 的 参数 。 它 们 的 关系 如 图 7-3 所 示 。 


n y square_sum 5 
3 4 25 
5 6 61 
7 8 113 


图 7-3 ”两 个 循环 对 象 之 间 的 关系 


一 定 程度 上 ，map0 函 数 能 替代 循环 的 功能 。 用 map0O 函 数 写 出 的 
程序 ， 看 起 来 也 相当 简洁 。 从 另 一 个 角度 来 说 ，map() 看 起 来 像 是 对 多 
个 目标 “各 个 击破 ”。 在 并 行 运算 中 ，Map 是 一 个 很 重要 的 过 程 。 通 过 
Map 这 一 步 ， 一 个 大 问题 可 以 分 拆 成 很 多 小 问题 ， 从 而 能 交 给 不 同 的 
主机 处 理 。 例 如 在 图 像 处 理 中 ， 融 可 以 把 一 张大 图 分 拆 成 许多 张 小 
图 。 每 张 小 图 分 配给 一 人 台 主 机 处 理 。 


2。filter 国 数 


和 map0O 函 数 一 样 ， 内 置 函 数 fiter0 的 第 一 个 参数 也 是 一 个 国 数 对 
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绷 返 回 的 是 True， 则 该 次 的 元 素 被 放 到 返回 的 迭代 器 中 。 也 就 是 说 ， 
filter() 通 过 调用 晃 数 来 策 选 数据 。 


下 面 是 使 用 filterO 国 数 的 一 个 例子 。 作 为 参数 的 larger1000 函 数 用 
于 判断 元 素 是 否 比 100 大 : 


def larger100(a): 
if a > 100: 
return True 
else: 


return False 


for item in filter(largeri00, [10,56,101,500]): 


print(item) 


类 似 的 ，filter0) 用 于 多 参数 的 水 数 时 ， 也 可 以 在 参数 中 增加 更 多 
的 可 循环 对 象 。 总 的 来 说 ，map0O 了 为 效 和 filter0 函 数 的 功能 有 相似 的 地 
方 ， 都 是 把 同一 个 函数 应 用 于 多 个 数据 。 


3. reduce% 


国 数 reduce0 也 是 一 个 常见 的 高 阶 函 数 。 函 数 reduce0 在 标准 库 的 
functools 包 中 心 ， 使 用 之 前 需要 引入 。 和 map0、reduce0 一 样 ， 
reduce0 国 数 的 第 一 个 参数 是 函数 ， 但 reduce0 对 作为 参数 的 函数 对 象 
有 一 个 特殊 要 求 ， 就 是 这 个 作为 参数 的 水 数 必须 能 接收 两 个 参数 。 
Reduce0 可 以 把 函数 对 象 累 进 的 作用 于 各 个 参数 。 这 个 功能 可 以 用 一 
个 简单 的 例子 来 说 明 : 


from functools import reduce 


data_list = [1,2,5,7,9] 
result = reduce(lambda x, y: x + y, data_list) 


print(result ) # 打印 24 


了 为 数 reduce0 的 第 一 个 参数 是 求 和 的 sum0 国 数 ， 它 接收 两 个 参数 X 
和 y。 在 功能 上 ，reduce() 累 进 的 运用 传 给 它 的 二 参 遂 数 。 上 一 次 运算 
的 结果 将 作为 下 一 次 调用 的 第 一 个 参数 。 首 先 ，reduce() 将 用 表 中 的 前 
两 个 元 素 1 和 2 做 sum() 遂 数 的 参数 ， 得 到 3。 该 运 回 值 3 将 作为 sum() 销 
数 的 第 一 个 参数 ， 而 将 表 中 的 下 一 个 元 素 5 作 为 sum() 遂 数 的 第 二 个 参 
数 ， 进 行 下 一 次 求 和 得 到 8。8 会 成 为 新 的 参数 ， 与 下 一 个 元 素 7 求 和 。 
上 面 过 程 不 断 重复 ， 和 直到 列表 中 元 素 耗 尽 。 鸳 数 reduce() 将 返回 昧 进 的 
运算 结果 ， 这 里 是 一 个 单一 的 整数 。 上面 的 例子 相当 于 
(((1+2)+5)+7)+9， 结 果 为 24。 也 就 是 如 图 7-4 所 示 过 程 。 


图 7-4 ”累进 运算 过 程 


疯 数 reduce() 通 过 某 种 形式 的 二 元 运算 ， 把 多 个 元 素 收 集 起 来 ， 形 
成 一 个 单一 的 结果 。 上 面 的 map()、reduce(0) 冰 数 都 是 单线 程 的 ， 所 以 
运行 效果 和 循环 差不多 。 但 map()、reduce() 可 以 方便 地 移植 到 并 行 化 
的 运行 环境 下 。 在 并 行 运算 中 ，Reduce 运 算 紧 接着 Map 运 算 。Map 运 
算 的 结果 分 布 在 多 个 主机 上 ，Reduce 运 算 把 结果 收集 起 来 。 因 此 ， 谷 
歌 用 于 并 行 运算 的 软件 架构 ， 就 称 为 MapReduceG)。 


4. 并行 处 理 


下 面 的 程序 就 是 在 多 进程 条 件 下 使 用 了 多 线程 的 map(0) 方 法 。 这 上 段 
程序 多 线程 地 下 载 同 一 个 URL 下 的 资源 。 程 序 用 了 第 三 方 包 requests 来 
进行 HTTP 下 载 : 


import time 


from multiprocessing import Pool 


import requests 


def decorator_timer(old_function): 


def new_function('arg, © dict_arg): 


t1 = time.time() 


result = old_function(‘arg, ~dict_arg) 
t2 = time.time() 

print("time: ", t2 - t1) 

return result 


return new_function 


def visit_once(i, address="http://www.cnblogs.com"): 
r = requests.get(address) 


return r.status_code 


@decorator_timer 
def single _thread(f, counts): 
result = map(f, range(counts) ) 


return list(result) 


@decorator_timer 


def multiple_thread(f, counts, process_number=10): 


p = Pool(process_number ) 


return p.map(f, range(counts) ) 


if _ name__ == "__main__": 
TOTAL = 100 
print(single_thread(visit_once, TOTAL) ) 


print(multiple_thread(visit_once, TOTAL) ) 


在 上 面 的 程序 中 ， 我 们 启动 了 10 个 进程 ， 并 行 地 处 理 100 个 下 载 需 
求 。 这 里 把 单个 下 载 过 程 描 述 为 一 个 图 数 ， 即 visit once0 ， 然 后 用 多 
线程 的 map0 方 法 ， 把 任务 分 配给 雇佣 来 的 10 个 工人 ， 也 就 是 10 个 进 
程 。 从 结果 可 以 看 到 ， 运 行 时 间 能 大 为 缩短 。 


75 目 上 而 下 
1. 便捷 表达 式 


在 本 章 的 一 开始 ， 我 们 就 提 到 函数 式 编 程 的 思维 是 自 上 而 下 式 
的 。Python 中 也 有 不 少 体现 这 一 思维 的 语法 ， 如 生成 器 表达 式 、 列 表 
解析 和 词典 解析 。 生 成 器 表达 式 是 构建 生成 器 的 便捷 方法 。 考 虑 下 面 
一 个 生成 器 : 


def gen(): 


for i in range(4): 


yield i 


等 价 的 ， 上 面 程序 可 以 写成 生成 器 表达 式 (Generator 


Expression) : 


gen = (x for x in range(4)) 


这 一 语法 很 直观 ， 写 出 来 的 代码 也 很 简洁 。 


我 们 再 来 看 看 生成 一 个 列表 的 方法 : 


l= [] 


for x in range(10): 


l.append(x**2) 


上 述 代 码 生 成 了 表 1， 但 有 更 快 的 方式 。 列 表 解 析 (List 
Comprehension) 是 快速 生成 列表 的 方法 。 它 的 语法 简单 ， 很 有 实用 价 
值 。 列 表 解 析 的 语法 和 生成 器 表达 式 很 像 ， 只 不 过 把 小 括号 损 成 了 中 
括号 : 


l = [x**2 for x in range(10)] 


列表 解析 的 语法 很 直观 。 我 们 直截了当 地 说 明了 想 要 的 是 元 素 的 
平方 ， 然后 再 通过 for 来 增加 限定 条 件 ， 即 哪些 元 素 的 平方 。 除了 for， 
列表 解析 中 还 可 以 使 用 if。 比 如 下 面 一 个 更 复杂 的 例子 : 


xl = [1,3,5] 
yl = [9,12,13] 


1 =[ x 2 for (x,y) in zip(xl,yl) if y > 10] 


词典 解析 可 用 于 快捷 的 生成 词典 。 它 的 语法 也 与 之 前 的 类 似 : 


d = {k: v for k,v in enumerate("Vamei") if val not in "Vi"} 
你 大 概 猜 出 它 的 结果 了 ， 可 以 在 Python 上 验证 一 下 。 


2. TRE 
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器 很 多 时 候 看 起 来 就 像 一 个 列表 。 比 如 下 面 的 迭代 器 和 列表 ， 效 果 上 


都 一 样 : 


for i in (x 2 for x in range(10)): 


print(i) 


for i in [x2 for x in range(10)]: 


print(i) 
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的 。 在 使 用 该 元 素 之 前 ， 元 素 并 不 会 占据 内 存 空 间 。 与 之 相对 应 ， 列 
表 在 建立 时 ， 就 已 经 产生 了 各 个 元 素 的 值 ， 并 保存 在 内 存 中 。 迭 代 器 
的 工作 方式 正 是 函数 式 编 程 中 的 懒惰 求 值 (Lazy Evaluation) 。 我 们 
可 以 对 迭代 器 进行 各 种 各 样 的 操作 。 但 只 有 在 需要 时 ， 迭 代 器 才 会 计 
算出 具体 的 值 。 


懒惰 求 值 可 以 最 小 化 计算 机 要 做 的 工作 。 比 如 下 面 的 程序 可 以 在 
Python 3 中 飞速 运行 完成 : 


a = range(100000000) 


result = map(lambda x: x2, a) 


在 Python 3 中 ， 上 面 程序 可 以 迅速 执行 。 因 为 map 返 回 的 是 迭代 
器 ， 所 以 会 懒惰 求 值 4。 更 早 之 前 的 range 调 用 返回 的 同样 是 运 代 器 ， 


也 是 懒惰 求 值 。 除 非 通 过 某 种 方式 调用 连 代 器 中 的 元 素 ， 或 者 把 迭代 
器 转化 成 列表 ， 运 算 过 程 才 会 开始 。 因 此 ， 在 下 面 的 程序 中 ， 如 果 把 
结果 转化 成 列表 ， 那 么 运算 时 间 将 大 为 增加 。 


a = range(100000000) 
result = map(lambda x: x 2, a) 
result = list(result) 


如 果 说 计算 最 终 都 不 可 避免 ， 那 么 懒惰 求 值 和 即时 求 值 的 运算 量 
并 没有 什么 差别 。 但 如 果 不 需 要 穷尽 所 有 的 数据 元 素 ， 那 么 懒惰 求 值 
将 节省 不 少时 间 。 比 如 下 面 的 情况 中 ， 列 表 提 前 准备 数据 的 方式 ， 就 
浪费 了 很 多 运算 资源 : 


for i in (x 2 for x in range(100000000) ): 
if i>1000: 


break; 


for i in [x 2 for x in range(100000000)]: 
if 1i>1000: 


break; 


除了 运算 资源 ， 懒 惰 求 职 还 能 节约 内 存 空 间 。 对 于 即时 求职 来 
说 ， 其 运算 过 程 的 中 间 结 果 都 需要 占用 不 少 的 内 存 空间 。 而 懒惰 求 值 


可 以 先 在 迭代 器 层面 上 进行 操作 ， 在 获得 最 终 迭 代 器 以 后 一 次 性 完成 
计算 。 除 了 用 mapO、tfilter0 等 图 数 外 ，Python 中 的 itertools 包 还 提供 了 
丰富 的 操作 迭代 器 的 工具 。 


3。itertools 包 


标准 库 中 的 itertools 包 提供 了 更 加 灵活 的 生成 迭代 器 的 工具 ， 这 些 
工具 的 输入 大 都 是 已 有 的 迭代 器 。 另 一 方面 ， 这 些 工 具 完 全 可 以 自行 
使 用 Python 实现 ， 该 包 只 是 提供 了 一 种 比较 标准 、 高 效 的 实现 方式 。 
这 也 符合 Python“ 只 有 且 最 好 只 有 一 个 解决 方案 ”的 理念 。 


#5|Aitertools 


from itertools import * 


这 个 包 中 提供 了 很 多 有 用 的 生成 器 。 下 面 两 个 生成 器 能 返回 无 限 
循环 的 迁 代 器 : 
count (5, 2) # 从 5 开始 的 整数 迭代 器 ， 每 次 增加 2， 即 5，7， 9, 11, 13 


cycle("abc") # 重 复 序列 的 元 素 , Bta, b, c, a, b, Cc ... 


repeat() 既 可 以 返回 一 个 不 断 重 复 的 迭代 器 ， 也 可 以 是 有 次 数 限 制 
的 重复 : 


repeat(1.2) # 重 复 1.2， 构 成 无 穷 迭代 器 ， 即 1.2,，1.2, 1.2,，..,. 


repeat(10, 5) ”# 重 复 10， 共 重复 5 次 


FRAGA IBAA AS, HERAT AIA ES: 


chain([1, 2, 3], [4, 5, 7]) # 连接 两 个 迭代 器 成 为 一 个 。1， 2, 3, 


4, 5, 7 
product("abc", [1, 2]) # SPANRBRANE ELA. AFRE 
循环 


所 谓 的 笛 卡 儿 积 可 以 得 出 集合 元 素 所 有 可 能 的 组 合 方式 : 


for m n in product("abc", [1, 2]): 


print(m, n) 


如 下 所 示 : 


permutations("abc", 2) # 从 "abcd" 中 挑选 两 个 元 素 ,， 比如 ab，bc,，.… 
# 将 所 有 结果 排序 ， 返 回 为 新 的 迭代 器 。 
# 上 面 的 组 合 区 分 顺序 ， 即 ab， ba 都 返回 。 


combinations("abc", 2) # 从 "abcd" 中 挑选 两 个 元 素 ， 比 如 ab ， bc, nn 
# 将 所 有 结果 排序 ， 返 回 为 新 的 迭代 器 。 
# 上 面 的 组 合 不 区 分 顺序 ， 
# 即 ab，ba， 只 返回 一 个 ab。 


combinations_with_replacement("abc", 2) # 与 上 面 类 似 ， 


# 但 允许 两 次 选 出 的 元 素 重复 。 即 多 了 aa， bb, cc 


itertools 包 中 还 提供 了 许多 有 用 的 高 阶 函 数 : 


starmap(pow, [(1, 1), (2, 2), (3, 3)]) # pow 将 依次 作用 于 表 的 每 个 
tuple. 


takewhile(lambda x: x < 5, [1, 3, 6, 7, 1]) # 4ee#oukelTruebt, 
# 收 集 元 素 到 迭代 器 。 一 旦 遂 数 返回 False， 则 停止 。1，3 


dropwhile(lambda x: x < 5, [1, 3, 6, 7, 1]) # 当 孙 数 返 回 False 时 ， 
# 跳 过 元 素 。 一 旦 遂 数 返回 True， 则 开始 收集 剩 下 的 所 有 元 素 到 迭代 器 。6，7， 


包 中 提供 了 groupby0 遂 数 ， 能 将 一 个 key0 遂 数 作 用 于 原 迭 代 器 的 
各 个 元 素 ， 从 而 获得 各 个 水 数 的 键 值 。 根 据 key() 遂 数 结果 ， 将 拥有 元 
素 分 组 。 每 个 分 组 中 的 元 素 都 保罗 了 键 值 形 同 的 返回 结果 。 MX 
groupby0 分 出 的 组 放 在 一 个 迭代 器 中 返回 。 


如 果 有 一 个 迭代 器 ， 包 含 一 群 人 的 身高 。 我 们 可 以 使 用 这 样 一 个 
keyO KK: 如 果 身 高 大 于 180， 返 回 "tal"; 如 果 身 高 低 于 160 ， 返 
回 "short"; 中 间 的 返回 "middle"。 最 终 ， 所 有 身高 将 分 为 三 个 迭代 器 ， 
即 "tall"、"short"、 "middle". 


from itertools import groupby 


def height_class(h): 
if h > 180: 
return "tall" 
elif h < 160: 
return "short" 
else: 


return "middle" 


friends = [191, 158, 159, 165, 170, 177, 181, 182, 190] 


friends = sorted(friends, key = height_class) 


for m, n in groupby(friends, key = height_class): 
print(m) 
print(list(n)) 


注意 ，groupby0 的 功能 类 似 于 UNIX 中 的 uniq 命 令 。 分 组 之 前 需 
使 用 sorted0 对 原 迭 代 器 的 元 素 ， 根 据 key0 函 数 进 行 排序 ， 让 同 组 元 素 
先 在 位 置 上 靠拢 。 


这 个 包 中 还 有 其 他 一 些 工具 ， 方便 迭代 器 的 构建 : 


compress("ABCD", [1, 1, 1, 0]) # 根 据 [1，1，1，0] 的 真 假 值 情况 ， 
选择 


# 保 留 第 一 个 参数 中 的 元 素 。A，B， C 


islice() # 类 似 于 slice() 国 数 ， 只 是 返回 的 是 
一 个 迭代 器 
izip() # 类 似 于 zip() 函 数 ， 只 是 返回 的 是 一 
个 迭代 器 。 


至 此 ， 本 书 介绍 了 Python 中 包含 的 阔 数 式 编 程 特征 : 作为 第 一 级 
TRAV, FA. ANA MERKE... AIRF KT aE AY 
语法 ， 以 函数 核心 提供 了 一 套 新 的 封装 方式 。 当 我 们 编程 时 ， 可 以 在 
面向 过 程 和 面向 对 象 之 外 ， 提 供 一 个 新 的 选择 ， 从 而 给 程序 更 大 的 创 
造 空 间 。 阔 数 式 编程 自 上 而 下 的 思维 ， 也 给 我 们 的 编程 带 来 更 多 启 
发 。 在 并 行 运算 的 发 展 趋势 下 ， 函 数 式 编 程 正 走 向 繁荣 。 和 希望 本 章 的 
内 容 能 对 你 的 国 数 式 编程 学 习 有 所 助 蔓 。 


(1) 在 Python 2.7 中 ，map0 返 回 的 是 一 个 列表 

(2) Python 2.7 中 ，reduce0 是 内 置 疯 数 ， 不 需要 引入 。 

(3) 参看 http://research.google.com/archive/mapreduce.html 

(4) Python 2.7 中 ，range0 和 mapO 返 回 的 都 是 列表 ， 所 以 是 即时 求 值 。 


后 记 


终于 完成 了 这 本 Python 教程 ， 可 以 松 一 口气 。 写 完 一 本 书 不 太 容 
易 。 即 使 是 完稿 之 后 ， 我 还 是 重新 过 了 三 四 遍 稿子 ， 改 动 了 不 少 的 地 
方 。 比 如 说 ， 我 在 写 对 象 名 时 ， 会 习惯 性 地 按照 Java 的 代码 规范 写成 
thisObject， 而 不 是 PEP8 规 定 的 this_object。 在 我 认为 ，thisObject 这 样 
的 写法 更 容易 让 对 象 和 函数 区 分 开 。 我 当然 可 以 这 么 做 ，PEP8 只 是 指 
导 性 的 代码 规 泌 ， 而 不 是 强制 要 求 。 但 我 又 担心 自己 会 误导 读者 。 半 
竟 ， 代 码 不 止 是 写 给 目 己 读 的 。 如 果 用 我 的 书写 形式 写成 Python 库 ， 
那么 其 他 遵照 PEP8 的 程序 员 在 调用 时 会 不 会 觉得 奇怪 ? 


反 反 复 复 思索 了 很 人 ， 直 到 有 一 天 想到 Python 诞 生 时 遵循 的 一 个 


理念 : 


“如 果 常 识 上 确立 的 东西 ， 就 可 以 遵照 常识 ， 没 有 必要 过 度 纠 
gt 


于 是 ， 我 选择 了 服从 PEP8 的 代码 规范 ， 把 书 中 的 代码 订正 了 一 


你 瞧 ，Python 的 理念 已 经 开始 在 指导 我 。Python 吸 引 我 的 ， 正 是 
这 样 一 些 旗帜 鲜明 的 理念 。 这 套 理念 甚至 被 整理 成 了 一 个 打油诗 。 如 
果 你 在 Python 中 运行 : 


import this 
就 可 以 调 出 这 个 名 为 "Python 之 道 ” (The Zen of Python) 的 诗 。 


The Zen of Python, by Tim Peters 


Python 之 道 

Beautiful is better than ugly. 
美观 胜 于 丑陋 。 

Explicit is better than implicit. 
显示 胜 于 隐 陈 。 

Simple is better than complex. 
简单 胜 于 复杂 。 

Complex is better than complicated. 
Flat is better than nested. 

RET are 

Sparse is better than dense. 
稀少 胜 于 稠密 。 

Readability counts. 

可 读 性 需要 考虑 。 

Special cases aren't special enough to break the rules. 


即使 情况 特殊 ， 也 不 应 打破 原则 ， 


题 。 


Although practicality beats purity. 

尽管 实用 胜 于 纯净 。 

Errors should never pass silently. 

错误 不 应 悄 无 声息 的 通过 ， 

Unless explicitly silenced. 

除非 特意 这 么 做 。 

In the face of ambiguity, refuse the temptation to guess. 

当 有 混淆 时 ， 拒 绝 猜测 (深入 的 搞 明 白 问题 ) o 

There should be one-- and preferably only one --obvious way to do it. 


总 有 一 个 ， 且 〈 理 想 情 况 下 ) 只 有 一 个 ， 明 显 的 方法 来 处 理 问 


Although that way may not be obvious at first unless you're Dutch. 


尽管 那个 方法 可 能 并 不 明显 ， 除 非 你 是 荷兰 人 。(Python 的 作者 


Guido 是 人 荷兰 人 ， 这 是 在 致 族 ) 


Now is better than never. 
现在 开始 胜 过 永远 不 开始 ， 


Although never is often better than “right” now. 


尽管 永远 不 开始 经 单 比 仑 促 立 即 开始 好 。 

If the implementation is hard to explain, it's a bad idea. 

如 果 程 序 实现 很 难 解释 ， 那 么 它 是 个 坏 主意 。 

If the implementation is easy to explain, it may be a good idea. 
如 果 程 序 实 现 很 容易 解释 ， 那 么 它 可 能 是 个 好 主意 。 
Namespaces are one honking great idea -- let's do more of those! 
命名 空间 是 个 绝 好 的 主意 ， 让 我 们 多 利用 它 。 


这 并 不 是 严格 的 逻辑 和 和 哲学 理念 。 有 的 地 方 说 法 有 矛盾 ， 必 须 由 
读者 在 实践 中 取舍 。 但 相信 每 个 人 都 会 被 它 乐 观 的 理想 主义 氛围 感 
染 。 在 “Python 之 道里 ， 世 界 是 可 知 的 ， 问 题 是 可 以 解决 的 ， 美 与 简 
单 是 可 以 抵达 的 。 当 你 学 完了 这 本 编程 教程 ， 开 始 上 手 Python 项 目 
时 ， 你 会 需要 类 似 的 乐观 主义 。 相 信 我 ， 你 一 定 会 觉得 写 程序 很 平 
昔 ， 会 觉得 某 个 问题 难以 解决 ， 会 觉得 学 编程 是 一 个 错误 。 如 果 哪 一 
天 你 没有 类 似 的 苦恼 ， 那 么 你 可 能 已 经 放弃 编程 了 。 


但 如 果 你 想 继续 ， 别 忘 了 这 首 “Python 之 道 ”， 想 一 想 有 没有 更 简 
单 的 方法 解决 你 的 问题 ， 找 一 找 是 否 已 经 存在 了 那个 最 好 且 唯 一 的 方 
法 ， 甚 至 是 先 用 一 个 不 太 好 看 但 能 用 的 方法 。Python 讲 究 实 用 性 。“ 实 
用 胜 于 纯净 ”，Python 并 非 一 味 沉 浸 于 理想 主义 。 它 为 了 解决 现实 问题 
而 诞生 ， 并 正在 解决 大 量 的 现实 问题 。 学 习 编 程 的 过 程 会 有 些 平 若 ， 
但 如 果 有 心 ， 还 请 快 快 开始 。 毕 竟 , “现在 开始 胜 过 永远 不 开始 ”。 相 
信 我 ， 学 成 之 后 你 会 看 到 一 个 不 一 样 的 次 元 。 


